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1 Einfiihrung 


1.1 Forschungsfrage und Aufbau des Buchs 


Oft geht wissenschaftliches Arbeiten damit einher, Bilder zu zeichnen. Sie spielen 
in allen Stadien der Forschung eine Rolle: Manchmal ordnen sie in Form einer 
fliichtigen Skizze die eigenen Gedanken, manchmal dienen sie dazu, komplexe 
Gedankengänge oder ein theoretisches Modell zu visualisieren und immer wieder 
werden konventionalisierte Formen verwendet, um empirische Ergebnisse darzu- 
stellen, etwa in Form von Balken- oder Liniendiagrammen. Bilder können aber 
auch dazu dienen, Forschungsgegenstände zu transformieren, so dass sie über- 
haupt erst analysierbar werden. 

Diese Bilder unterscheiden sich von einem Gemälde dadurch, dass sie dia- 
srammatische Eigenschaften aufweisen. Diagramme sind einerseits „graphische 
Abkürzungsverfahren für komplexe Schematisierungen“ (Stetter 2005, 125) und 
sind dadurch andererseits gleichzeitig ein Phänomen „operativer Bildlichkeit“ 
(Krämer 2009, 94). Wenn wir einen in Eile auf’s Papier gebrachten Kreis als Dia- 
gramm auffassen, sehen wir in ihm eine Realisierung des abstrakten Typs eines 
geometrisch definierten idealen Kreises. Fassen wir ihn als nicht-diagrammati- 
sches Bild auf, erfreuen wir uns vielleicht am eleganten Schwung der Stiftfüh- 
rung und nehmen die sich ändernden Strichdicken wahr. 


Abb. 1: Ein Kreis als Diagramm oder Bild 


Wenn wir den Kreis jedoch als Diagramm auffassen, können wir damit operieren, 
indem wir beispielsweise mit einem Strich durch die (ungefähre) Mitte des Kreises 
verlaufend den Durchmesser andeuten. Die Unzulänglichkeiten des Diagramms 
(der Kreis entspricht nicht allen Kriterien der geometrischen Figur ‚Kreis‘, so trifft 
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der Endpunkt der Linie nicht auf den Anfangspunkt, damit kann kein Mittel- 
punkt bestimmt werden, von dem aus der Radius zu allen Kreispunkten identisch 
ist etc.) spielen keine große Rolle, da sie das Bild nicht genug verfremden, um es 
nicht mehr als Variante eines idealen Kreises aufzufassen. 

Die Palette an unterschiedlichen Diagrammen ist breit: Man denke an 
die bekannten Balken-, Linien- und Kreisdiagramme, aber auch an speziali- 
siertere Diagramme wie Streudiagramme, Boxplots (auch: Kastengrafiken) 
oder Heatmaps, hin zu Graphen (auch ‚Netzdiagramme‘ genannt), Venn- 
(Mengendiagramme) und Flussdiagrammen. Doch auch Karten gehören dazu, in 
der Linguistik etwa als Dialektkarten häufig eingesetzt. 

Neben diesen prototypischen Diagrammen möchte ich den Blick aber auch 
auf weniger offensichtliche diagrammatische Darstellungen lenken: Dazu 
gehören z. B. Listen und Tabellen. Die Liste ist selbstverständlich auch außerhalb 
der Linguistik eine wichtige informationsstrukturierende Darstellung, entfaltete 
aber in der Linguistik beispielsweise in der Form von Konkordanzen eine beson- 
dere Wirkung. Ein anderes Beispiel sind Partituren oder partiturartige Darstel- 
lungen, wie sie in der Linguistik für die Transkription gesprochener Sprache ver- 
wendet werden. 

Thema dieses Buches sind Diagramme in der ganzen oben angedeuteten 
Breite und ihre Verwendung in der Linguistik.'! Ein Kernstück dieser Arbeit bildet 
dabei die Beantwortung der Frage, welche Typen von Diagrammen in der Lingu- 
istik überhaupt eine wichtige Rolle spielten und spielen. So ist es nämlich bemer- 
kenswert, in welche semiotische Gemengelage wir geraten, wenn sprachliche 
Zeichen - selbst bereits komplexe Zeichen - in einen anderen Zeichentyp, wie 
etwa Diagramme, transformiert werden und damit überdies bestimmte sprach- 
immanente Eigenschaften (wie etwa Sequenzialität von Text) verloren gehen 
oder modifiziert werden. Diese Bestandsaufnahme wird jedoch erst in Kapitel 5 
ausgebreitet und diskutiert. 

Zunächst möchte ich im ersten Teil die Grundlagen vorbereiten, um Dia- 
gramme in der Linguistik nicht einfach als mitunter bunte Grafiken beschreiben 
zu können, sondern in wissenschaftskulturelle und wissenschaftspraktische 


1 Ich werde im Folgenden die Termini „Linguistik“ und „Sprachwissenschaft(en)“ gleich- 
bedeutend verwenden und meine damit die ganze Breite des Fachs von der allgemeinen und 
vergleichenden Sprachwissenschaft zu den einzelphilologischen bis hin zu sozial- und kultur- 
wissenschaftlich geprägten Sprachwissenschaften. Trotz dieser Offenheit bin ich bis zu einem 
bestimmten Grad in der germanistischen Sprachwissenschaft verhaftet, lasse meinen Blick je- 
doch von der Sprachgeschichte, Morphologie, Syntax, Semantik, Sozio-, Text-, Gesprächs- und 
interaktionale Linguistik bis zu Diskurs-, kulturwissenschaftliche Linguistik und mehr schwei- 
fen. 
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Zusammenhänge einzubetten. Diese Zusammenhänge sind vielfältig: Zunächst 
drehen sich die Ausführungen um das Diagrammatische am Diagramm und ins- 
besondere seine Rolle in der Wissenschaft (Kapitel 2). Darauf hin lenke ich den 
Blick stärker auf die Praxis des wissenschaftlichen Arbeitens mit Diagrammen, 
insbesondere in der Sprachwissenschaft (Kapitel 3). Das Diagramm ist selbst ein 
komplexes Zeichen, das prima vista in erster Linie darstellen soll, wobei bald 
deutlich werden wird, dass sich die Funktionen darin längst nicht erschöpfen, 
etwa wenn man beispielsweise an die rhetorischen Funktionen von Diagrammen 
denkt. Um die wissenschafts-disziplinären Wirkungsweisen von Visualisierun- 
gen zu verstehen, lohnt der Einbezug von Ludwik Flecks Theorie der „Denkstile“, 
die für eine Disziplin konstituierend sind. Im Anschluss daran ist zu fragen: 
Inwiefern sind Diagramme Ausdruck von in der jeweiligen Disziplin herrschen- 
den Paradigmen und tragen sie gleichzeitig zur Konstruktion dieser Paradigmen 
bei? Diese Gedanken führen dann zu Überlegungen über die Macht diagramma- 
tischer Kanons auf die Visualisierungspraxis und die Konsequenzen des Abwei- 
chens davon. 

Besonders in der ausgeprägt empirisch arbeitenden Linguistik werden Dia- 
gramme normalerweise nicht manuell gezeichnet, sondern vom Computer über 
einen Algorithmus erzeugt. Dieser Prozess ist weit mehr, als einfach die Erstel- 
lung eines Diagramms mit anderen Mitteln, denn er setzt „verdatete“ Sprache 
voraus. Der Untersuchungsgegenstand muss in Form von Daten vorliegen, mit 
denen ein Computer operieren kann. Diese „Verdatung“ ist selbst bereits ein Set 
von diagrammatischen Operationen, wie auch die nachgelagerte Analyse und 
das, was wir dann als eigentlichen Akt der Erstellung eines Diagramms wahr- 
nehmen. Die Anfänge der Diagramm-Genese liegen also bereits bei den ersten 
Schritten der Verdatung, daher ist es wichtig, diesen Prozess, der maßgeblich 
von der „diagrammatischen Maschine“ Computer geprägt ist, zu reflektieren 
(Kapitel 4). Wichtig ist dabei jedoch, dass diese vielleicht zu technizistische Sicht 
ergänzt wird durch einen Fokus auf die kulturelle Einbettung des dafür nötigen 
Programmierens selbst, wobei ich den Terminus der „Coding Cultures“ als wich- 
tigen Aspekt des Umgangs mit Diagrammen in den Wissenschaften stark machen 
möchte (Kapitel 4.4). 

Diese Ausführungen sind grundlegend, um im Anschluss fünf in der Lingu- 
istik bedeutende Grundformen von Diagrammen zu spezifizieren und auf ihre 
Funktionen hin zu untersuchen: Listen, Karten, Partituren, Graphen und Vekto- 
ren (Kapitel 5). 

Unter der Überschrift „Praktiken“ werden anschließend im zweiten Teil drei 
Beispiele für visuelle Analyseprozesse präsentiert. Zweimal geht es um korpus- 
linguistisch geprägte Arbeiten, in denen es darum geht, komplexe Daten über 
Visualisierungen analysierbar zu machen. Im ersten Beispiel handelt sich um 
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Daten mit Ortsbeziigen (Sprachgebrauch und Ort, Kapitel 6): Es werden ,,Geokol- 
lokationen“ berechnet, also Kollokatoren zu Toponymen, und auf Karten visuali- 
siert, um die sprachliche Konstruktion von Welt sichtbar zu machen. Das zweite 
Beispiel dreht sich um typische Sequenzen von sprachlichen Mustern (Sprach- 
gebrauch und Sequenz, Kapitel 7): Ausgangspunkt sind Alltagserzählungen von 
Müttern über die Geburten ihrer Kinder und die Berechnung und Visualisierung 
von narrativen Mustern, die diese Erzählungen strukturieren. Ein drittes Beispiel 
stellt die traditionelle Darstellung von gesprochener Sprache in Transkripten in 
Frage und schlägt Alternativen vor, um Zeitlichkeit und Sozialität von Gesprä- 
chen besser sichtbar zu machen (Sprachgebrauch und Interaktion, Kapitel 8). 

Im dritten und letzten Teil „Folgen“ werden die aus den Fallbeispielen 
gewonnenen Erkenntnisse zu einer integrierten diagrammatischen Methodolo- 
gie für die Linguistik zusammengeführt (Kapitel 9). Diese Methodologie ist nicht 
als ein abgeschlossenes Set von analytischen Handlungsanweisungen zu ver- 
stehen, sondern soll mögliche Grundhaltungen aus geisteswissenschaftlicher 
Sicht gegenüber diagrammatischen Prozessen generell, insbesondere gegenüber 
diagrammatischen Operationen, der Verdatung und der Algorithmisierung der 
diagrammatischen Operationen vorschlagen. Insbesondere ist auch das inter- 
disziplinäre Spannungsfeld zwischen den häufig verwendeten Methoden, die 
den „Sciences“ entlehnt sind und in den „Humanities“ angewandt werden, zu 
problematisieren. Schließlich ist vor dem Hintergrund der wirkmächtigen Diszi- 
plinierung diagrammatischer Kanons zu fragen, wo die Chancen für Rebellion 
gegenüber dieser Disziplinierung liegen, um Innovation in der Visualisierung 
von Sprachdaten zu begünstigen. 


1.2 Kontextualisierung: Diagrammatische Perspektive auf 
Sprache 


Blättert man linguistische Arbeiten durch, findet man wahrscheinlich nicht über- 
mässig viele grafische Darstellungen. Vielleicht fallen einem hin und wieder 
Syntaxbäume oder Dialektkarten auf, die spezifisch sprachwissenschaftli- 
che Darstellungen sind. Daneben wird man gewöhnliche Balken-, Linien- und 
Kuchendiagramme finden, die immer dann zum Einsatz kommen, wenn quanti- 
tative Mengenverhältnisse dargestellt werden sollen. 

Trotzdem scheinen mir in der Linguistik Diagramme eine äußerst bedeu- 
tende Rolle zu spielen. Oben habe ich bereits angetönt, dass auch unauffällige 
Ordnungsstrukturen wie Listen als diagrammatische Elemente aufgefasst werden 
können. Tut man das, ist die Grenze zwischen Visualisierung und Transformati- 
onen von Daten, von Visualisierung und Analyse, nicht mehr trennscharf. Hier 
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befinden wir uns dann auch in einer Gemengelage, die verschiedene Perspekti- 
ven auf Darstellungen zusammenbringt, die teils lange Traditionen haben, teils 
erst in jüngster Zeit akzentuiert worden sind: 


In den Digital Humanities spielen Visualisierungen von Daten eine große 
Rolle (Drucker 2008; Jänicke et al. 2016). So visualisiert etwa Maximilian 
Schich (Schich et al. 2014), auf den ich später noch detaillierter eingehen 
werde, Geburts- und Sterbedaten auf einer Karte, um kulturelle Entwicklun- 
gen darstellen zu können. 

Die Visual Analytics wiederum sind eine Forschungsrichtung, die riesige 
Datenmengen bewältigen wollen, indem sie Aspekte davon grafisch darstel- 
len (Keim et al. 2008; Dill et al. 2012). Nur so - so die Hoffnung - ist es über- 
haupt möglich, Muster in den Daten zu erkennen und die Daten zu verstehen. 
Die Diagrammatik verbindet epistemische Fragen mit Darstellung: Sie verbin- 
det Semiotik, Medialität, Philosophie, Erkenntnistheorie und Wissenschafts- 
geschichte um zu untersuchen, wie Diagramme Zeichen transformieren, mit 
den Diagrammen operiert und Erkenntnisse gewonnen werden (Stjernfelt 
2007; Bauer/Ernst 2010; Krämer 2016). Aus dieser Perspektive wird deutlich, 
warum der erste Eindruck einer eher armen Visualisierungstradition in der 
Linguistik falsch ist: Diagrammatisches ist für das Fach essentiell, um über- 
haupt erforschen zu können, was erforscht wird. 

Oft fallen algorithmisch erstellte Visualisierungen in den Blick. Damit in den 
Digital Humanities oder den Visual Analytics Visualisierungen überhaupt 
fruchtbar gemacht werden können, bedarf es computergestützter Visuali- 
sierungsmethoden. Es sind teilweise raffinierte Algorithmen, die eine große 
Datenmenge von Relationen zu einem gemeinsamen Netz formen, das wie- 
derum so ausgelegt wird, dass es interpretiert werden kann. Die Software 
Studies, bzw. eine Analyse des Programmcodes innerhalb von Software, 
liefern das Rüstzeug für einen kritischen Blick auf diese Algorithmen (Fuller 
2008). 

Die Überlegungen, die mit den oben genannten Perspektiven einher gehen, 
können in einen wissenschaftsgeschichtlichen Kontext eingebettet werden. 
Welche Funktionen Visualisierungen in wissenschaftlichen Disziplinen ein- 
nehmen, welche Praktiken damit verbunden und welche Stile vorherrschend 
sind, ändert sich historisch und unterscheidet sich disziplinär. Mit Ludwik 
Flecks Theorie der „Denkstile“ (Fleck 1980) lassen sich diese Prozesse gut 
fassen - es spielen also allgemein wissenshistorische und wissenstheoreti- 
sche Aspekte eine wichtige Rolle in der vorliegenden Untersuchung. 

Und schließlich breite ich meine ganzen Überlegungen vor dem Hintergrund 
einer Linguistik aus, die sich für kulturwissenschaftliche, pragmatische und 
sprachgebrauchsorientierte Ansätze interessiert und deshalb Konzepte wie 
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Kultur, Praktiken, Sprachgebrauch, Musterhaftigkeit ins Zentrum stellt (Linke 
2003; Feilke/Linke 2009; Bubenhofer 2009). Dies betrifft einerseits die im 
Teil „Praktiken“ ausgeführten Fallbeispiele, wie auch die diagrammatische 
Reflexion und Theoriebildung selber. 


Diese Gemengelage bietet m.E. einen interessanten Zugriff auf das Diagramma- 
tische in der Linguistik. Es geht nicht bloß darum zu untersuchen, welche Dia- 
gramme in der Linguistik Verwendung finden. Linguistische diagrammatische 
Praxis ist also nicht einfach Untersuchungsgegenstand einer Diagrammatik. 
Sondern (kultur-)linguistische Theorien erweitern ihrerseits die diagrammati- 
sche Perspektive. 


1.3 Diagrammatik 


Diagramme scheinen eine Konstante menschlicher Kultur zu sein. Sie dienen 
dazu, Wissen sichtbar zu machen, und zwar so, dass Relationen innerhalb dieses 
Wissens deutlich werden und daraus wiederum neue Erkenntnisse gewon- 
nen werden können. Bereits vor Jahrtausenden wurden sog. Token, also kleine 
Objekte aus Ton, verwendet, um eine Anzahl von Tieren oder Gegenständen zu 
repräsentieren (Schmandt-Besserat 1996). Manchmal wurden sie in größere Ton- 
gefäße zusammengefasst („Bullae“), die dann wiederum beschriftet wurden, um 
eine größere Einheit zu repräsentieren. 

Bereits hier wird deutlich, dass Anordnungen von Objekten in einem Raum 
als Wissensspeicher verwendet wurden. Doch darüber hinaus ermöglicht eine 
solche Repräsentation weitere Operationen: Mit einer Herde von Tieren, reprä- 
sentiert durch die Token, kann in Abwesenheit der Tiere gehandelt werden. 
Token können weitergegeben oder als Garantie für eine Gegenleistung angesehen 
werden. 

Vielleicht erscheint das Beispiel der Token und Bullae nicht als typisch 
diagrammhaft: Ein wichtiges Element eines Diagramms ist normalerweise die 
grafische Inskription auf einer Fläche, die so eine Räumlichkeit in ebendieser 
Fläche eröffnet. Wenn man allerdings die sprachphilosophischen Schriften von 
Charles Sanders Peirce der zweiten Hälfte des 19. Jahrhunderts berücksichtigt, 
eröffnet sich die weitere semiotische Dimension von Diagrammen weit über die 
prototypische Vorstellung, was ein Diagramm sei, hinaus. Zentraler Gedanke der 
Pierce’schen Diagrammatik ist die Unterscheidung der Zeichentypen Index, Ikon 
und Symbol und das ikonische Abbildungsverhältnis. Die sprachphilosophischen 
Überlegungen von Peirce - er spricht auch das erst Mal von „diagrammatic rea- 
soning“ — wurden wegen der schwierigen Editionssituation der Schriften jedoch 
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erst im Laufe des 20. Jahrhunderts intensiv rezipiert (Bauer/Ernst 2010, 40; vgl. 
dazu Kapitel 2.2.1). Wie Kramer (2016, 20) betont, ist es aber eine ganze Reihe 
von Denkern, für die die „Rolle räumlicher Orientierung für das Philosophieren“ 
bedeutend war: „Platon, Aristoteles, Niklaus von Kues, Descartes, Leibniz, Kant, 
Peirce, Frege, Wittgenstein, Heidegger, Deleuze oder Derrida“ (Krämer 2016, 
20-21). 

Es ist bezeichnend für eine neuere, kulturwissenschaftliche oder post- 
strukturalistische Diagrammatik, Elemente des Diagrammatischen abseits der 
Fläche zu sehen: So kann das Theater als „diagrammatisches Dispositiv“ (Haß 
2005) aufgefasst und generell „die Analyse audiovisueller Medien [...] oder die 
Malerei in eine poststrukturalistisch akzentuierte Diagrammatologie“ eingebun- 
den werden (Bauer/Ernst 2010, 310). Hat man einmal den Blick mit dem Interesse 
für das Diagrammatische eingenommen, erscheinen viele Phänomene, wie etwa 
die Aufführung eines Theaterstücks, als räumliches Operieren mit Zeichen, die je 
für sich, aber eben gerade auch als relational zueinander bestimmtes Ensemble 
von Zeichen insgesamt, in einem Abbildungsverhältnis zum Gemeinten stehen. 
Entsprechend weist auch das eingangs erwähnte Beispiel der Token und Bullae 
diagrammatische Züge auf. 

Wichtige Impulse zu einer Diagrammatik des Bildes kamen aus den Bildwis- 
senschaften, wenn man etwa an „Das technische Bild“ denkt (Bredekamp et al. 
2008). Einerseits interessiert sich da die Kunstgeschichte für „Gebrauchsbilder“ 
und untersucht deren Stilgeschichte, andererseits entdeckt sie in den Kunstge- 
genständen, Gemälden und Zeichnungen das Diagrammatische (Bender/Marri- 
nan 2010; Bogen/Thürlemann 2003). Siegel interessiert sich beispielsweise für 
die „Figuren der Ordnung um 1600“ (Siegel 2009) und zeigt an Savignys Tableaux 
von 1587, wie das Wissen einer Zeit in einer Mischung von Wort, Diagramm und 
Tafel repräsentiert und damit operiert wird (vgl. dazu Kapitel 2.3). 

Das Diagrammatische bietet auch bei der Anwendung auf Texte eine neue 
Perspektive. Bauer und Ernst (2010, 14f.) verweisen etwa auf Gomringers Figu- 
rengedichte, bei denen die Anordnung und Ausrichtung der Wörter auf der Text- 
fläche hochgradig bedeutungstragend sind und gleichzeitig „zur spielerischen 
Rekonfiguration der Verhältnisse“ verleiten. Doch auch hier ist das offensicht- 
liche Beispiel, bei dem Platzierung auf der Fläche sofort als bedeutungsrele- 
vant einleuchtet, Ausgangspunkt für einen Blick auf die weniger prominenten 
Beispiele. So verwies etwa Steinseifer (2013) auf die Diagrammatizität von Text 
(Listen, Paragraphen, Inhaltsverzeichnisse etc.) und spricht von „neuartigen 
Formen des diagrammatischen Schreibens“ bei der digitalen Textproduktion, da 
nichtlineare Zugriffsformen auf den Text, z.B. das Setzen von Links, parallel mit 
dem Verfassen entstehen, während früher dies von einander getrennte Schritte 
waren (Steinseifer 2013, 33). 
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Welche Rolle Diagramme nicht nur für die Darstellung von Texten, sondern in der 
Linguistik insgesamt spielen, wird Thema der folgenden Kapitel dieses Buches 
sein. Die dafür notwendigen Grundlagen der Diagrammatik werden zudem in 
Kapitel 2.2, vor allem in Anlehnung an Sybille Krämers Diagrammatologie, aus- 
gebreitet. Für allgemeinere Einführungen in die Diagrammatik verweise ich auf 
„Diagrammatology: An Investigation on the Borderlines of Phenomenology, 
Ontology and Semiotics“ von Frederik Stjernfelt (2007), „Diagrammatik: Einfüh- 
rung in ein kultur- und medienwissenschaftliches Forschungsfeld“ von Matthias 
Bauer und Christoph Ernst (2010), „The Culture of Diagram“ von John Bender und 
Michael Marrinan (2010, übers.: 2014) und „Figuration, Anschauung, Erkenntnis: 
Grundlinien einer Diagrammatologie“ von Sybille Krämer (2016). 


Grundlagen 


2 Diagrammatik und Wissen 


2.1 Fragestellung 


Beginnen wir unsere Überlegungen mit einer Alltagssituation — der Suche nach 
einer Abbildung über einen der typischen Browser-Suchdienste. Beispielhaft 
habe ich nach „Organonmodell“ mittels Google-Bildersuche recherchiert. Abbil- 
dung 2 zeigt einen Ausschnitt des Ergebnisses: Eine Vielzahl von Darstellungen 
von Karl Bühlers Organon-Modell (Bühler 1934). Bestimmt haben linguistisch 
informierte Leserinnen und Leser eine Darstellung des Modells im Kopf, die den 
mit der Bildersuche gefundenen Darstellungen ähnelt. 


Bühler, der das Modell über mehrere Seiten hinweg entwickelt, beschreibt 


seine Darstellung wie folgt: 


Wir respektieren diese Tatsachen [psychophysische Systeme sind Selektoren als Empfän- 
ger und Formungsstationen als Sender] und zeichnen das Organon-Modell der Sprache ein 
zweites Mal in Figur 3. Der Kreis in der Mitte symbolisiert das konkrete Schallphänomen. Drei 
variable Momente an ihm sind berufen, es dreimal verschieden zum Rang eines Zeichens zu 
erheben. Die Seiten des eingezeichneten Dreiecks symbolisieren diese drei Momente. Das 
Dreieck umschließt in einer Hinsicht weniger als der Kreis (Prinzip der abstraktiven Rele- 
vanz). In anderer Richtung wieder greift es über den Kreis hinaus, um anzudeuten, daß das 
sinnlich Gegebene stets eine apperzeptive Ergänzung erfährt. Die Linienscharen symboli- 
sieren die semantischen Funktionen des (komplexen) Sprachzeichens. Er ist Symbol kraft 
seiner Zuordnung zu Gegenständen und Sachverhalten, Symptom (Anzeichen, Indicium) 
kraft seiner Abhängigkeit vom Sender, dessen Innerlichkeit es ausdrückt, und Signal kraft 
seines Appells an den Hörer, dessen äußeres oder inneres Verhalten es steuert wie andere 
Verkehrszeichen. (Bühler 1934, 28) 


Bei einer ersten Betrachtung der Ergebnisse der Suche (s. u. Abbildung 2) fallen 
folgende Aspekte auf: 


1. 


Die von Bühler skizzierte Figur ist ein Schema, ein Diagramm, von einem 
speziellen Typus. Es unterscheidet sich beispielsweise von einem Balkendia- 
gramm insofern, als dass es keine empirischen Werte repräsentiert, sondern 
ein theoretisches Modell grafisch darstellt. Wir lesen die Figur als Diagramm, 
also als Abkürzung für etwas Gemeintes. Die Vielfalt an Varianten des origi- 
nären Organon-Modelles in der Google-Bildersuche zeigen genau dies, denn 
alle Varianten teilen bestimmte Grundelemente aufeine bestimmte Art. In fast 
allen ist die Konstellation eines Objekts in der Mitte und drei davon abgehen- 
den Verbindungen zu jeweils einem Objekt vorhanden. Eine kleinere Menge 
teilt noch weitere Ähnlichkeiten: Das Dreieck als Zeichen und der darüber 
liegende Kreis als Schallphänomen, die Linienscharen zu den drei „Momen- 
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Abb. 2: Ergebnis der Suche nach „Organonmodell“ in der Google-Bildersuche (27. 9. 2017) 


ten“, die das Schallphänomen zum Zeichen erheben, die Beschriftung der 
Elemente etc. Die Darstellungen zeigen aber auch, was offensichtlich keine 
relevanten grafischen Aspekte sind, so etwa die Farbe, die Schriftdicke, die 
Schriftart der Beschriftungen, der genaue Ort der Beschriftungen etc. 

2. Bühlers Organon-Modell wird oft zitiert und auch in modifizierter Form ver- 
wendet. Es existiert also eine Praxis der Diagrammverwendung, wobei damit 
auch Veränderungen, etwa Vereinfachungen, des ursprünglichen Modells 
einhergehen, die linguistische Expert/innen in Kenntnis des Originaltextes 
und der Originalgrafik als verfälschend bezeichnen könnten. Es gibt aber 
wohl auch solche, die den Anspruch erheben würden, die Idee Bühlers 
vollständig verstanden, jedoch auf wesentliche Aspekte reduziert oder aber 
weiter entwickelt zu haben. Je weiter man in der Google-Ergebnis-Ansicht 
nach unten scrollt, desto größer wird der Variantenreichtum. 

3. Als Google-Ergebnis ist auch eine Fotografie zu sehen, auf der eine Frau ein 
Whiteboard beschreibt. Sie scheint zwar nicht das Diagramm von Bühler auf- 
zuzeichnen, jedoch dessen Elemente als angereicherte Liste, was ebenfalls 
eine diagrammatische Form ist. Das zeichnerische Entwickeln eines Dia- 
gramms vor den Augen eines Publikums ist ein Beispiel für den Handungs- 
aspekt von Diagrammen: Es wäre zu kurz gegriffen, ein Diagramm bloß in 
seiner Endform zu analysieren. Denn Diagramme entstehen unter bestimm- 
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ten sozialen Bedingungen und in bestimmten sozialen Konstellationen, z. B. 
im Unterricht, und dienen während dieser Entstehung bestimmten Funktio- 
nen. Diagramme sind also Teil von Handlungen. 

4. Die verschiedenen Realisierungen sind unter verschiedenen technischen 
Bedingungen entstanden. Da alle Darstellungen digital vorliegen, wurden 
zwar alle in einem letzten Schritt digitalisiert, doch sie sind offensichtlich 
davor mit unterschiedlichen Techniken entstanden: Am Computer mit einem 
Grafikprogramm gezeichnet (als Vektor- oder als Pixelgrafik), von Hand 
gezeichnet oder aus einem gedruckten Buch kopiert. 


Konkret möchte ich in meiner Untersuchung die folgenden vier Aspekte von Dia- 
grammen betrachten: Beim diagrammatischen Aspekt geht es darum, was ein 
Diagramm ausmacht und welche Typen es gibt. Beim Aspekt der Praxis steht die 
Frage im Zentrum, was eine bestimmte Gemeinschaft, z.B. Linguistinnen und 
Linguisten, mit Diagrammen tun und welche Effekte dies auf das Diagramm und 
das Wissen, das mit dem Diagramm repräsentiert wird, hat. Beim Handlungs- 
aspekt ist von Interesse, wie mit Diagramm und unter welchen Konstellationen 
Handlungen vollzogen werden, etwa wenn Diagramme eingesetzt werden, um 
Fachkompetenz zu demonstrieren. Und letztlich fokussiert der Aspekt der tech- 
nischen Bedingungen auf die Medialität und Materialität bei der Erstellung und 
Verwendung von Diagrammen. 

Diese vier Aspekte sollen die Studie durchgehend perspektivieren, auch 
wenn sie sich nicht immer trennscharf voneinander abzugrenzen lassen. In den 
folgenden drei Kapiteln werden nun zunächst die diagrammatischen Grundlagen 
erarbeitet und die Spezifika von wissenschaftlichen und insbesondere sprach- 
wissenschaftlichen Diagrammen erörtert. 

Diese Fragen sollen vor dem Hintergrund linguistischer Visualisierungspra- 
xis diskutiert werden. Zentral ist dabei die Frage, welche Diagrammtypen oder 
diagrammatischen Operationen zu welchen Gegenstandskonstitutionen führen; 
wie wir in der Linguistik also durch die Verwendung bestimmter diagrammati- 
scher Grundfiguren unsere Gegenstände erst schaffen. Ein wichtiger Aspekt ist 
dabei die Benutzung des Computers: Einerseits als Mittel der Verdatung von 
sprachlichen Phänomenen, andererseits als Metamedium, mit dem Diagramme 
erstellt werden können. 

Gegenstand der vorliegenden Arbeit ist keine umfassende Bestandsauf- 
nahme diagrammatischer Praxis in der Linguistik. Eine bereits ältere Studie von 
Ann Harleman Stewart leistete dies zumindest für die grafische Darstellung von 
linguistischen Modellen: „Graphic representation of models in linguistic theory“ 
(1976). Jedoch wandelte sich seit den 1970er-Jahren sowohl die Linguistik als 
auch die diagrammatische Praxis mit der „pragmatischen Wende“ (Feilke 2000, 
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64) selbst. Als nach der pragmatischen Wende korpuslinguistisch sozialisierter 
Linguist habe ich zudem einen noch anderen Blick auf das Fach. Daher liegt 
der Fokus dieser Arbeit nicht nur auf grafischen Darstellungen von Modellen, 
sondern auch auf grafischen Repräsentationen von empirischen Daten. 

Wichtig ist mir überdies, die breite Palette von Diagrammen und ihren Funk- 
tionen im Blick zu haben. Diagramme werden in der Linguistik einerseits ver- 
wendet, um theoretische Modelle zu visualisieren, jedoch auch, um sprachliche 
Daten zu repräsentieren — sowie für Aufgaben, die dazwischen liegen, etwa wenn 
ein Syntaxbaum (Modell) auf Daten angewandt wird. Grundsätzlich sind bei den 
meisten Überlegungen alle Typen mitgemeint. Dennoch ergibt sich im Verlauf der 
Studie ein Schwergewicht Richtung Daten repräsentierende Diagramme, insbe- 
sondere von solchen, die massenhaft vorhanden sind und deshalb manuell nicht 
mehr überblickt werden können. Dies erklärt auch den Exkurs über die Frage, 
welche Rolle der Computer als „diagrammatische Maschine“ in diesem Zusam- 
menhang spielt. 

Die Breite der Palette zeigt sich auch darin, dass ich nicht nur Diagramme 
im engeren Sinn, wie Achsendiagramme (Balken-, Linien-, Streudiagramme etc.), 
Graphen und Karten, betrachte, sondern auch diagrammatisch geordnete Text- 
darstellungen wie Listen, Tabellen oder Partituren (wie sie z.B. fiir Gesprächs- 
transkripte verwendet werden). Dieses weite Verständnis von ‚Diagramm‘ werde 
ich in Abschnitt 2.2.3 noch genauer definieren. 


2.2 Diagramme 
2.2.1 Grundlagen 


Ein Diagramm ist ein grafisches Abkürzungsverfahren für komplexe Schematisie- 
rungen (Stetter 2005, 125). Es steht in einem ikonischen Verhältnis zum Denotat, 
allerdings so, dass es als „Verwirklichung eines abstrakten Modells“ (Eco 1977, 55) 
wahrgenommen wird. Die Balkenlängen eines Diagramms stehen zwar in einem 
ikonischen Verhältnis zu den Frequenzrelationen, die sie repräsentieren, jedoch 
nicht zu den tatsächlich gezählten Entitäten. Denn schon vor der Überführung in 
ein Balkendiagramm hat eine Schematisierung stattgefunden: Das Vorkommen 
von irgendwelchen Entitäten (Wortfrequenzen in Korpora, Ja-Nein-Antworten von 
Proband/innen, gemessene Längen von Wurmarten etc.) wurde in Zahlenwerten 
ausgedrückt und damit mathematisch modelliert. Dieses mathematische Modell 
kann nun in einem Diagramm repräsentiert werden. Ähnlich verhält es sich mit 
dem eingangs bereits aufgeführten Beispiel der Darstellung des Organon-Modells 
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von Karl Bühler: Dessen Denotat ist ein abstraktes Modell des Zeichens und das 
Diagramm steht in einem ikonischen Verhältnis dazu. 

Dieses ikonische Verhältnis ist allerdings komplex. Charles Sanders Peirce 
(1994a) kann als Begründer der Diagrammatik angesehen werden. Er entwickelt 
seine Vorstellung der Diagrammatik im Kontext der drei Zeichentypen Index, 
Ikon und Symbol. Während Symbole in einem arbiträren, konventionell fest- 
gelegten Verhältnis zum Bezeichneten stehen, ist das indexikalische Zeichen 
mit einem symptomatischen und das Ikon über eine Ähnlichkeitsrelation zum 
Bezeichneten definiert: 


An Icon is a sign which refers to the Object that it denotes merely by virtue of characters of 
its own, and which it possesses, just the same, whether any such Object actually exists or 
not. It is true that unless there really is such an Object, the Icon does not act as a sign; but 
this has nothing to do with its character as a sign. Anything whatever, be it quality, existent 
individual, or law, is an Icon of anything, in so far as it is like that thing and used as a sign 
of it. (Peirce 1994a, 2.247) 


Das Ikon denotiert ein Objekt also blo& aufgrund seines eigenen Charakters und 
nicht etwa als Symptom des Objektes (wie der Index). Und zwar, so weit es ähnlich 
ist wie das Objekt und es als Zeichen dafür verwendet wird. 

Diagramme sind nun im Verständnis von Peirce ein bestimmter Typ eines 
Ikons, genauer, eines Hypoikons. Dafür muss man jedoch Peirces zentrale drei 
Kategorien des Erkennens, nämlich Erstheit (Firstness), Zweitheit (Secondness) 
und Drittheit (Thirdness), berücksichtigen (Peirce 1994b, 1.2426). Verkürzt dar- 
gestellt versteht Peirce unter Erstheit eine unmittelbare Gegenwärtigkeit ohne 
Relation zu irgendetwas anderem: „Firstness is the mode of being which con- 
sists in its subject’s being positively such as it is regardless of aught else.“ (Peirce 
1994b, 1.25) Mit dem Erkennen im Modus der Zweitheit wird eine Relation wahr- 
genommen, ein Widerstand: 


A court may issue injunctions and judgments against me and I not care a snap of my finger 
for them. I may think them idle vapor. But when I feel the sheriff’s hand on my shoulder, I 
shall begin to have a sense of actuality. (Peirce 1994b, 1.24) 


Erst mit dem Gefühl der Hand des Sheriffs auf meiner Schulter nehme ich in einer 
Zweitheit den Urteilsspruch als Faktum wahr. Werden nun solche Fakten der 
Zweitheit in ihrer Regelhaftigkeit wahrgenommen und nehmen so einen genera- 
lisierenden Charakter ein, sind sie ein Fall von Drittheit: ,,[...] the mode of being 
which consists in the fact that future facts of Secondness will take on a determi- 
nate general character, I call a Thirdness“ (Peirce 1994b, 1.26). 
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Nun können wir nachvollziehen, wie Peirce zwei Typen von Ikonen definiert, 
sozusagen ein „pures“ Ikon und ein Hypoikon: 


A sign by Firstness is an image of its object and, more strictly speaking, can only be an 
idea. For it must produce an Interpretant idea; and an external object excites an idea by a 
reaction upon the brain. But most strictly speaking, even an idea, except in the sense of a 
possibility, or Firstness, cannot be an Icon. A possibility alone is an Icon purely by virtue of 
its quality; and its object can only be a Firstness. But a sign may be iconic, that is, may repre- 
sent its object mainly by its similarity, no matter what its mode of being. If a substantive be 
wanted, an iconic representamen may be termed a hypoicon. (Peirce 1994a, 2.276) 


Diese Hypoikons können nun wiederum unterteilt werden, je nachdem, welcher 
Art die Erstheit ist, an der sie beteiligt sind: 


Hypoicons may be roughly divided according to the mode of Firstness of which they partake. 
Those which partake of simple qualities, or First Firstnesses, are images; those which rep- 
resent the relations, mainly dyadic, or so regarded, of the parts of one thing by analogous 
relations in their own parts, are diagrams; those which represent the representative char- 
acter of a representamen by representing a parallelism in something else, are metaphors. 
(Peirce 1994a, 2.277) 


Der entscheidende Punkt ist also, dass Diagramme Relationen eines Objektes mit 
eigenen Relationen repräsentieren, und so eine Analogie zum Objekt herstellen. 
Bauer und Ernst (2010, 40) betonen in ihrer Interpretation von Peirces Schrif- 
ten, dass danach das Ikon (oder eben ein Diagramm) nicht einen Gegenstand 
abbildet, sondern vielmehr ein Ikon „eine in sich schlüssige Regel [repräsentiert], 
mittels derer man sich ein Bild von dem Objekt machen kann“ (Bauer/Ernst 2010, 
43). Das Ikon muss ja, um Zeichen zu bleiben, in einem Differenzverhältnis zum 
Gegenstand stehen. Peirce konzipiert das Verhältnis zum Gegenstand deswegen 
pragmatisch: Was kann mit dem Zeichen getan werden? Und was tut das Zeichen? 


Das Diagramm-Ikon entwirft in der Darstellung eine Hypothese über den Gegenstand, 
indem es auf andere Wissensbestände zurückgreift. Mittels des Diagramms wird eine These 
entwickelt, die Wissen über das Objekt entwickelt. Diagrammatische Ikonizität ist daher 
nicht abbildende, sondern entwerfende Ähnlichkeit. (Bauer/Ernst 2010, 44) 


Mit dieser Deutung der Ähnlichkeitsbeziehung ist der entscheidende Schritt 
gemacht, um die Operationalität von Diagrammen zu fassen: „the diagram as 
vehicle for mental experiment and manipulation“ (Stjernfelt 2007, 99). Mit einer 
diagrammatisch dargestellten Hypothese über den Gegenstand lässt sich arbei- 
ten. So dient ein Stadtplan dazu, mögliche Wege zu finden, geometrische Zeich- 
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nung helfen, Winkelrelationen zu finden etc. Darauf werde ich, Sybille Kramers 
Diagrammatik folgend (Abschnitt 2.2.2), noch genauer eingehen. 

Stjernfelt verweist aber an dieser Stelle auf den durchaus signifikanten 
Punkt, dass diese entwerfende Ahnlichkeit erst durch eine spezifische Benut- 
zung des Diagramms entsteht. Als Beispiel dafiir verweist Stjernfelt auf die Foto- 
grafie eines Baumes: 


Take a photograph of a tree — it is an icon in so far as not previously explicit information 
may be gathered from it — say, e.g. the fact that the crown of the tree amounts to two thirds of 
its overall height. This fact was remarked nowhere earlier, neither by the photographer nor 
the camera nor the developer - and by noticing it you performed a small experiment of dia- 
grammatic nature: you took the trunk of the tree and moved upward for your inner gaze in 
order to see it cover the height of the crown twice, doing a bit of spontaneous metric geom- 
etry, complete with the implicit use of axioms like the invariance of translation. Of course, 
this is an ordinary icon in so far as nobody constructed it with a diagrammatic intention. 
Nevertheless, you used it - in actu - that way. This continuum between diagrams proper 
(be it pure or empirical) and diagrammatic use of ordinary icons shows the centrality of the 
diagram for the icon category as such. It is with diagrammatic means that the operational 
use of the icon proceeds. (Stjernfelt 2007, 101) 


So gewendet wird also deutlich, dass Ikonen Diagrammatizität eingeschrieben 
ist: Sie werden zu Ikonen, weil sie diagrammatisch verwendet werden. Und es 
verdeutlicht einmal mehr den pragmatischen Aspekt von Diagrammen, wie ihn 
Bauer und Ernst auch im obigen Zitat betonen. 

Diese knappen Ausführungen werden der Peirce’schen Diagrammatik keines- 
wegs gerecht. Insbesondere mit Frederik Stjernfelts „Diagrammatology“ (2007) 
liegt jedoch eine detailgenaue Arbeit vor, die die diagrammatischen Theorien von 
Peirce angemessen würdigen, diskutieren und reflektieren. Im Zusammenhang 
mit den Überlegungen der vorliegenden Studie möchte ich aber doch auf eine 
Eigenschaft von Diagrammen zu sprechen kommen, nämlich diejenige, durch 
„Rekonfiguration der im Diagramm dargestellten Relationen“ (Bauer/Ernst 2010, 
46) zu neuen Erkenntnissen zu gelangen, also die Möglichkeit, mit Diagrammen 
„etwas tun“ — operieren - zu können. Peirce verweist in diesem Zusammenhang 
auf die beiden Typen von Deduktion, korollare und theorematische Deduktion, 
die mit Diagrammen möglich sind: 


A Corollarial Deduction is one which represents the conditions of the conclusion in a 
diagram and finds from the observation of this diagram, as it is, the truth of the conclusion. 
A Theorematic Deduction is one which, having represented the conditions of the conclusion 
in a diagram, performs an ingenious experiment upon the diagram, and by the observation 
of the diagram, so modified, ascertains the truth of the conclusion. (Peirce 1994a, 2.267) 
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Im ersten Fall dient das Diagramm also der Verifizierung einer Schlussfolge- 
rung - die behauptete Schlussfolgerung liegt also bereits im Diagramm vor und 
es handelt sich um eine korollare, also ‚triviale‘ Schlussfolgerung. Im zweiten Fall 
jedoch wird mit dem Diagramm operiert in Form eines „ausgeklügelten Experi- 
ments“, um sich der Wahrheit der Schlussfolgerung zu versichern. 

Sybille Krämer spricht dann im Rahmen ihrer Diagrammatik auch von einer 
„operativen Bildlichkeit“ (Krämer 2009, 94), wodurch sich Diagramme von 
anderen Bildern unterscheiden. Im Folgenden sollen Krämers Arbeiten dazu 
dienen, im Anschluss an Peirce die Eigenschaften von Diagrammen genauer zu 
bestimmten und für die vorliegende Arbeit fruchtbar zu machen. 


2.2.2 Sybille Krämers Diagrammatik 


Hilfreich zum Verständnis der Operationalität von Diagrammen sind die Arbei- 
ten von Sybille Krämer zu Diagrammatik. Sybille Krämer (2016) entwickelte eine 
Diagrammatik und eine Diagrammatologie, die als Leitfaden für die Erarbeitung 
der theoretischen Grundlagen und ihre Anwendung auf Diagramme in der Lingu- 
istik dienen soll. Sie nennt zwölf Eigenschaften als Eckpunkte einer Grammatik 
der Diagrammatik, die ich im Folgenden kurz referieren möchte. Die wichtigste 
Eigenschaft für die Entwicklung der Hypothesen in der vorliegenden Studie ist 
dabei die „Operationalität“. Doch zunächst sind die grundlegenderen Eigen- 
schaften von Diagrammen zu diskutieren. 


Bild-Text-Verbindung: Die Maxime „ein Bild sagt mehr als tausend Worte“, die 
suggeriert, ein Bild könne alleine für sich stehen, ist falsch. Ebenso falsch ist 
die Annahme, ein Diagramm sei ein effektives Mittel, um Komplexität in einem 
einfach zu verstehenden Bild auszudrücken. 


Diagramme sind nicht selbsterklärend. Kein Diagramm erfüllt ohne das Umfeld eines 
begleitenden Textes heuristische oder gar demonstrative Funktionen. Diagramme verkör- 
pern eine textverankerte und textgebundene Form des Bildlichen, wobei dieser Textbezug 
auch durch eine mündliche Praxis gestiftet werden kann. (Krämer 2016, 60) 


Dies ist bei einem Beispiel wie dem Organon-Modell sofort einleuchtend. Die 
Erklärung von Bühler zum Modell ist im Minimum notwendig, um es deuten zu 
können.? Dennoch nimmt das Verständnis und die Lesbarkeit zu, je mehr man 


2 Eine beliebte Versuchsanordnung im linguistischen Propädeutikum illustriert dies gut: Man 
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sich mit ähnlichen Modellen auseinandergesetzt hat. Diesen Effekt der Kanoni- 
sierung ist insbesondere auch bei statistischen Standarddiagrammen zu beob- 
achten. Der sogenannte Boxplot (Kastengrafik), wie in Abbildung 3 gezeigt, ist 
für ungeschulte Rezipient/innen mehr oder weniger unlesbar, für alle anderen 
jedoch ein einfach lesbares Diagramm, das eine Menge an Informationen enthält. 
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Abb. 3: Boxplot zur Verteilung von Personalpronomen in drei verschiedenen Korpora (aus: 
Bubenhofer 2013b) 


Allerdings sind zahlreiche Phänomene beobachtbar, bei denen ein Diagrammtyp 
oder auch eine ganz bestimmte Realisierung „autark“ wird, sich gewissermaßen 
verselbständigt und ins „Bildgedächtnis einer Kultur eingeschrieben“ (Krämer 
2016, 61) wird. Uwe Pörksen prägte in diesem Zusammenhang für solche Visuali- 
sierungen den Begriff der „Visiotype“ als „Ausdruck und Prägestock einer Öffent- 
lichkeit“ (Pörksen 1997, 105). 


Extrinsische Materialität: Für ein Gemälde ist die Leinwand, für eine Skulptur 
das Material, aus dem sie gestaltet ist, von Bedeutung und kann nicht ausgewech- 
selt werden, ohne dessen Charakter grundsätzlich zu verändern. Diagramme 
jedoch sind „ihrer konkreten Stofflichkeit prinzipiell auswechselbar [...]. Daher 
ist die Materialität des Diagramms imprägniert von einer Immaterialität“ (Krämer 
2016, 62). Trotzdem kommt das Diagramm nicht ohne Materialität aus, da es sich 


lege den Studierenden das Diagramm ohne weitere Informationen vor und bitte sie, es zu deu- 
ten. Es wird dabei eine breite Variation von ganz verschiedenen Deutungen auftreten. 
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ja gerade nicht bloß um „Gedankenbilder“ handelt. Weil mit Diagrammen etwas 
getan wird, sind sie in einem Gebrauch verankert, der damit auch eine räumli- 
che und zeitliche Verankerung mitbringt: Diagramme werden in verschiedenen 
raumzeitlich charakterisierbaren Situationen verwendet. Mit den unterschiedli- 
chen Verwendungen wechseln sie dabei auch ihre Materialität immer wieder, was 
auch die Beispiele oben mit den Erscheinungsformen des Organon-Modells zeigt. 
Da wissenschaftliche Diagramme heute meistens algorithmisch erstellt 
werden, ist die Frage der Materialität und Immaterialität noch viel grundlegen- 
der. Wenn das Diagramm durch Code-Anweisungen immer wieder neu aus Daten 
heraus entsteht und seine digital Repräsentation auf beliebigen Displays zur 
Anzeige gebracht wird, gibt es nicht nur zwei Ebenen der Materialität und Imma- 
terialität, sondern digitale Repräsentationen in einem elektronischen Raum 
dazwischen. Darauf wird in Kapitel 4 noch ausführlich einzugehen sein. 


Flächigkeit: Mit dem Zeichnen aufeinen Grund wird „ein artifizieller Sonderraum 
geschaffen, welcher auf der Annullierung eines uneinsehbaren Dahinter/Darun- 
ter beruht und einen synoptischen Überblick stiftet, der uns im dreidimensionalen 
Umgebungen - gewöhnlich - versagt ist“ (Krämer 2016, 65). Wir lesen die Zeich- 
nung als zweidimensionale Übersicht, auch wenn es faktisch diese Zweidimen- 
sionalität gar nicht gibt, da weder das Papier noch der Farbauftrag des Striches 
wirklich flach sind. Für Diagramme ist diese Annahme von Flächigkeit besonders 
relevant, da sie uns dazu zwingt, die im Diagramm repräsentierten Informationen 
auf einer Fläche auszubreiten und dadurch die Synopse erst zu ermöglichen. Dies 
gilt natürlich gerade auch für dreidimensionale Diagramme, egal ob als perspek- 
tivisch gezeichnetes Diagramm auf Papier oder dargestellt auf einem Bildschirm, 
denn in beiden Fällen handelt es sich um Projektionen auf eine zweidimensionale 
Fläche, die Räumlichkeit lediglich suggeriert, aber niemals räumlich ist. 

Vor dem Hintergrund von Virtual-Reality-Anwendungen (VR), mit denen 
Räumlichkeit über ein entsprechendes Instrument wie eine VR-Brille o.ä. erleb- 
bar gemacht wird, muss Flächigkeit als Eigenschaft von Diagrammen präzisiert 
werden: Im Grunde geht es ja darum, einen artifiziellen Sonderraum zu schaf- 
fen, der eine synoptische Sicht ermöglicht, die sonst nicht möglich wäre. Das 
bekannte Mittel ist die Dimensionsreduktion in einen zweidimensionalen Raum, 
mit dem dann eben eine Fläche geschaffen wird. Es sind aber auch Dimensions- 
reduktionen höherer Ordnung denkbar, etwa indem ein komplexer n-dimensi- 
onaler Raum, bei dem n > 3 ist, in ein drei- oder zweidimensionales Diagramm 
überführt wird. Dies ist bei Vektorräumen der Fall, in denen z.B. Eigenschaften 
von Texten als numerische Ausprägungen ausgedrückt und so die Textein einem 
nicht mehr darstellbaren Vektorraum repräsentiert werden, da der Vektorraum 
so viele Dimensionen hat wie Eigenschaften (z.B. unterschiedliche Wörter) 
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gemessen werden (vgl. dazu Abschnitt 5.4). Die räumliche Anordnung der Texte 
kann nun in einen (simulierten) drei- oder zweidimensionalen Raum projiziert 
werden. Während auf Papier die dreidimensionale Darstellung simuliert werden 
muss, kann sie in einem virtuellen Raum einer VR-Anwendung in ihrer Dreidi- 
mensionalität leicht erlebbar gemacht werden. Dies wäre sogar als reales dreidi- 
mensionales skulpturales Diagramm umsetzbar, wobei im virtuellen Raum auch 
physikalisch unmögliche Darstellungen erlebbar gemacht werden können. Daher 
produziert die VR-Darstellung ebenfalls einen Sonderraum, der den eigentlichen 
Daten nicht genau entspricht, jedoch eine Synopse bietet, die ansonsten nicht 
möglich wäre, da wir uns Räume mit mehr als drei Dimensionen nicht vorstellen 
können. Entscheidend am Kriterium der Flächigkeit ist also nicht, dass zwingend 
eine zweidimensionale Darstellung entsteht, sondern dass durch Dimensionsre- 
duktionen ein Sonderraum geschaffen wird, der eine Synopse ermöglicht. 

Flächigkeit ist kein exklusives Charakteristikum von Diagrammen. Bilder 
generell arbeiten damit, wobei in nicht-diagrammatischen Kontexten Flächigkeit 
häufiger durchbrochen wird, etwa durch starken (und bedeutungsvollen) Farb- 
auftrag, Einbezug von Unebenheiten des Malgrundes ins Bild (etwa in der Höh- 
lenmalerei oder der Street Art) etc. 

Ulrich Schmitz (2015, 117) spricht in diesem Zusammenhang von der Sehflä- 
che und sieht bei der Anordnung von Text auf der Fläche ein Verhältnis zwischen 
Grammatik und Design: Je mehr Design (also je wichtiger die Anordnung auf der 
Fläche), desto weniger wichtig ist Grammatik — und umgekehrt. 


Graphismus: Die Fläche ist notwendig, um Inskription zu ermöglichen, gleich- 
zeitig wird sie durch die Inskription überhaupt erst als Fläche wahrgenommen: 
„Die menschliche Artikulationsform des Graphismus geht hervor aus der Inter- 
aktion von Punkt, Linie und Fläche und bildet eine gemeinsame Wurzel der 
Zeichnung wie der Schrift, folgenreich für kognitive wie für ästhetische Belange“ 
(Krämer 2016, 68). Krämer sieht damit im Anschluss an anthropologischen 
Studien die graphische Artikulationsform als ebenbürtig zur sprachlichen Arti- 
kulationsform. Um den mit der Inskription verbundene Handlungsaspekt zu 
betonen, spricht Krämer von der „Geste des Linienzugs“ (Krämer 2016, 69) alsein 
wichtiges Element des Diagramms. 

Doch gibt es Diagramme ohne grafische Elemente, etwa solche, die nur aus 
einer Anordnung von Text bestehen? Zu denken ist an Listen, Gleichungen oder 
in der Linguistik etwa an Gesprächstranskripte, die ohne grafischen Formen aus- 
kommen, sondern einzig Textzeilen räumlich anordnen. Doch auch da ist über- 
deutlich, dass die Linien zwar nicht sichtbar sind, jedoch mitgedacht werden 
müssen, um die Darstellung als Diagramm auffassen zu können. 
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Relationalität: Graphismus alleine führt noch nicht zu einem Diagramm, denn 
Diagramme „stellen Relationen mit Hilfe von Relationen dar“ (Krämer 2016, 70). 
Beim Organon-Modell stellen die Linien zwischen dem grafischen Zeichen für 
„Zeichen“ und denjenigen für „Sender“, „Empfänger“ und „Gegenstände und 
Sachverhalte“ die postulierten Relationen des Zeichens zu seinen Funktionen 
dar. Bei einem Balkendiagramm besteht eine Relationalität zwischen den jewei- 
ligen Balken untereinander. Sie stellen gleichzeitig eine grafische Repräsenta- 
tion eines numerischen Relationssystems dar: Die numerischen Werte stehen 
ebenfalls in Relationen zueinander. Und die grafische Repräsentation entwirft 
eine Relation zu den numerischen Werten. Der Relationalität kommt daher eine 
doppelte Funktion zu: „einerseits als Medium und andererseits als Bezugsobjekt 
diagrammatischer Sichtbarmachung“ (Krämer 2016, 70). Die räumlichen Relati- 
onen in Diagrammen denotieren dabei meistens nichträumliche Relationen, mit 
Ausnahme von Karten, Grundrisszeichnungen etc. 

Bei der diagrammatischen Darstellung von Sprachdaten ist dieser Aspekt 
besonders zu bedenken, z. B. bei Gesprächstranskripten: Ein Gespräch zwischen 
mehreren Personen ist raumzeitlich organisiert und führt zu mehreren parallel 
aufzufassenden Sequenzen von Sprachäußerungen. Mit dem Gesprächstran- 
skript wird nun versucht, die Parallelität der Sequenzen zu erhalten, etwa durch 
eine Partiturschreibweise. Mit dem Diagramm findet also eine Transformation 
von einer raumzeitlichen in eine räumliche Ordnung statt. Ich gehe daraufin den 
Abschnitten 3.1 und 5.3 noch ausführlicher ein. 


Gerichtetheit: Jedes Diagramm artikuliert mit seinen Inskriptionen auf der 
Fläche eine bestimmte Richtung. Dabei ist zwischen intrinsischer und extrinsi- 
scher Ausrichtung zu unterscheiden: Die intrinsische Ausrichtung eines Balken-, 
Linien- oder Punktediagramms wird etwa durch das Koordinatensystem etab- 
liert. Alleine schon Text benötigt eine Gerichtetheit, um ihn überhaupt lesen zu 
können und stellt deshalb bereits eine Minimalform eines Diagramms dar. Auch 
dem Diagramm zum Organon-Modell wohnt eine Gerichtetheit inne, die von 
einem Zentrum und davon ausgehenden Linien charakterisiert ist. Deutlich sind 
auch Karten gerichtet; solange ihre Relation zu den Himmelsrichtungen unbe- 
kannt ist, kann sie nicht zur Orientierung verwendet werden. 

Mit der extrinsischen Ausrichtung bezeichnet Krämer (2016, 72) die „phäno- 
menale Ausrichtung“, also die „Nutzerorientierung des Diagramms“, was, wenn 
es „auf den Handlungsbezug und den Gebrauch ankommt, [...] der vielleicht 
grundlegendste Aspekt“ sei. 

Ähnlich wie schon beim Aspekt der Relationalität sind die Transformations- 
prozesse bezüglich Gerichtetheit bei sprachlichen Daten besonders interessant. 
Denn die Sequenzialität von Text wird mit vielen diagrammatischen Darstel- 
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lungen aufgebrochen und in ein anders gerichtetes Diagramm überführt. Auch 
darauf werde ich insbesondere in den Abschnitten 4.1 und 5.1 zurückkommen. 


Simultaneität/Synopsis: Die Projektion von Relationen mit grafischen Mitteln 
auf die Fläche erzeugt „Simultaneität als Synopsis des Nebeneinanders“ (Krämer 
2016, 74), also das, was man gemeinhin mit „Übersichtlichkeit“ meint. Während 
beispielsweise die Lektüre von Bühlers Beschreibung des Organon-Modells über 
mehrere Sätze hinweg mehrere Sekunden dauert und der Sequenzialität des 
Textes und der Zeitlichkeit von textuellem Verständnis folgen muss, erfasst der 
Blick auf das Diagramm das Nebeneinander der Komponenten und die Relatio- 
nen zueinander. Auch bei einem Diagramm kann eine Lektüre mehr oder weniger 
sequenziell erfolgen, doch sie ist individueller und erfasst gleichzeitig mehr, da 
komplexe grafische Formen auf einen Blick wahrgenommen werden können. 

Bemerkenswert ist zudem, dass die synoptische Darstellung auch die „vor- 
wegnehmende Präsentation zukünftiger Verläufe in Form von Programmen, Ins- 
truktionen und Vorhersagen“ (Krämer 2016, 74) ermöglicht; man denke etwa an 
ein Liniendiagramm, wo die mögliche Weiterführung der Linie aufgrund des Dar- 
gestellten unweigerlich weitergedacht wird. Die simultane Anordnung erzeugt 
somit Stabilität, indem Zeit „verlangsamt“ wird, und Sozialität, da „Fluidität“ 
sozusagen eingefroren und damit einer intersubjektiven Rezeption zugäng- 
lich gemacht wird (Krämer 2016, 75). Man denke bei beiden Aspekten an ein 
Gesprächstranskript, was für eine Analyse gesprochener Sprache, die intersub- 
jektiv nachvollziehbar sein soll, unabdingbar ist. 


Schematismus: Diagramme sind auf Reproduzierbarkeit angelegte Darstellun- 
gen, die einen überindividuellen, allgemeinen, generischen Charakter ausweisen. 
Das Diagramm hat also in der Form der Instantiierung des abstrakten Schemas 
eine sinnliche, aber zugleich eben auch eine nicht-sinnliche Facette. „Worauf es 
alleine ankommt, ist: Alles, was schematisch ist, kann wiederholt und in dieser 
Wiederholung - absichtsvoll oder versehentlich — zugleich variiert werden. Dies 
ist ein Grundzug aller diagrammatischer Artefakte“ (Krämer 2016, 77). 

Im Schematismus liegt auch ein wichtiger Unterschied zu Bildern als Kunst- 
werken, die kaum als bloße Instantiierung eines abstrakten Schemas aufgefasst 
werden, sondern denen, auch wenn sie z. B. ein bestimmtes Motiv realisieren, weit 
mehr Eigenständigkeit zugesprochen wird. Die Grenze zwischen Schema und Bild 
kann jedoch durchlässig werden, etwa bei Kinderzeichnungen: Während jüngere 
Kinder Zeichnen relativ deutlich als Instantiieren von Schemata, die sie im Kopf 
haben, auffassen, entwickelt sich bei den älteren Kindern ein Sensorium für 
einen ästhetischen Mehrwert. Während bei den kleineren Kindern Strichdicke, 
Farbwahl etc. eher zufällig zu sein scheinen und für sie deshalb als eher bedeu- 
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tungslos aufgefasst werden, ändert sich das bei den älteren Kindern (Schulz 2007, 
71). Ähnlich scheint es durchaus auch bei Diagrammen ein Kontinuum zwischen 
reinem Schematismus und sozusagen künstlerischem Anspruch zu geben. Auf 
die Rolle von Ästhetik bei Diagrammen wird im Rahmen der Überlegungen zu 
Diagrammkulturen (Kapitel 3.3) und Coding Cultures (Kapitel 4.4) noch zurück- 
zukommen sein. 


Referenzialität: Diagramme stellen Relationen mit grafischen Mitteln dar, refe- 
rieren dabei aber auf Relationen von „diagrammexternen Sachverhalten [...], 
seien diese willkürlich (Sternbild) oder natürlich (Fieberkurve), seien diese 
empirisch (Sitzverteilung im Parlament) oder begrifflich (geometrische Figuren; 
Begriffsbäume)“ (Krämer 2016, 78). Diagramme sind also immer fremd-, nicht 
selbstbezüglich. Wenn gesagt wird, Diagramme zeigen etwas, dann ist mit diesem 
Verb „zeigen“ zu wenig ausgesagt, denn Diagramme haben eine konstituierende 
Wirkung; sie konstituieren „im Akt ihrer materialen und sichtbaren Einschrei- 
bung“ eine Relation, auf die sie zeigen - eine „inskriptionsunabhängige ‚Begeg- 
nung‘ mit dem dargestellten Objekt ist unmöglich“ (Krämer 2016, 79). Krämer 
spricht in diesem Zusammenhang von der Idee der „transnaturalen Abbildung“, 
mit der strukturelle Analogien zwischen dem diagrammexternen Sachverhalt 
und dem Diagramm gemeint sind. 

Die Referenzialität von Diagrammen gilt es nun insbesondere in Verbindung 
mit den Aspekten der Gerichtetheit und Relationalität zu durchdenken, um zu 
verstehen, wie in der Linguistik durch Diagramme Untersuchungs- oder Analy- 
segegenstände konstituiert werden. Schon jetzt ist deutlich, dass Diagramme 
nicht auf die Funktion des Abbildens bestimmter sprachlicher Sachverhalte 
reduziert werden können. Stattdessen ist einem bestimmten Diagrammtypus 
immer ein Set an Regelausprägungen eingeschrieben, mit denen Relationen auf 
einer auf bestimmte Art konfigurierten Fläche dargestellt werden, wobei — und 
das ist der entscheidende Punkt — damit erst das Relationensystem des Sach- 
verhalts konstituiert wird. Pointiert formuliert konstituieren Diagramme die 
Untersuchungsgegenstände, und sie tun dies je auf unterschiedliche Arten, so 
dass je nach Diagrammwahl auch unterschiedliche Gegenstände konstituiert 
werden. So geschieht dies beispielsweise mit der Überführung eines Gesprächs 
in eine schriftliche Form (Gesprächstranskript) oder der Zusammenführung aller 
Verwendungen eines bestimmten Lexems in einem Textkorpus in eine Konkor- 
danzliste. Damit entstehen je spezifische Untersuchungsgegenstände, wobei die 
Wahl einer anderen diagrammatischen Darstellung auch einen anderen Untersu- 
chungsgegenstand hervorbringen würde. Alternative Formen für ein Gesprächs- 
transkript könnten eine Audio-Aufnahme oder eine Spektrogramm-Darstellung 
der Aufnahme sein. Anstelle einer Konkordanzliste könnte ein Kollokationspro- 
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fil eines Lexems erstellt oder das Distributionsverhalten des Lexems in einem 
n-dimensionalen Vektorraum verortet werden. Auch darauf werde ich zuriick- 
kommen (Kapitel 3), wobei dann umso dringender die Frage diskutiert werden 
muss, nach welchen Kriterien bestimmte Diagrammtypen benutzt werden, also 
in welchem wissenschaftskulturellen Setting dies passiert. 


Sozialität: Dass Diagramme in einem (wissenschafts-)kulturellen Setting verortet 
werden können, ist die Folge ihrer Sozialität: „Diagramme eröffnen die Anschau- 
ung von etwas, das individuell wahrgenommen wird, und zwar ,im Modus des 
Wir‘, eingebettet in normativ geprägte Praktiken, die keineswegs explizit sein 
müssen, sondern oftmals implizit in kulturellen Gebräuchen verankert sind, 
organisieren Diagramme geteilte epistemische Erfahrungen“ (Krämer 2016, 80). 
Diagramme sind also in kulturelle Gewohnheiten eingebettet - ihr Gebrauch 
folgt, könnte man mit Ludwik Fleck (1980) sagen, bestimmten Denkstilen (vgl. 
dazu Abschnitt 3.2). 


Operationalität: Wie bereits mehrfach anklang, ist ein Diagramm also weit mehr 
als eine Visualisierung von Relationen mit grafischen Mitteln auf einer Fläche. 
Vielmehr sind Diagramme Werkzeuge, um damit zu operieren und zu neuen Ein- 
sichten zu gelangen: 


Gleich einer Karte, welche Bewegungen in einem unvertrauten Terrain eröffnet, ermög- 
lichen Diagramme, dass wir praktisch oder theoretisch etwas tun, was ohne Diagramm 
schwer oder überhaupt nicht auszuführen ist. Diagramme sind graphische Denkzeuge; sie 
eröffnen kognitive Bewegungsmöglichkeiten, insofern ihrem Gebrauch ein transfiguratives 
Potenzial innewohnt, kraft dessen graphische Konstellationen und deren handgreifliche 
Manipulation als intellektuelle Tätigkeiten interpretierbar werden. (Krämer 2016, 83) 


Der Grad der Operationalität ist nicht bei jedem Diagramm gleich ausgeprägt. 
Bei einer Dialektkarte oder einem Gesprächsstranskript ist er vergleichsweise 
hoch: Die Diagramme stellen zunächst das Wissen dar, das bekannt ist: Die ein- 
zelnen Erhebungspunkte und Ausprägungen einer Variable bei der Dialektkarte, 
die Gesprächsbeiträge der Gesprächsteilnehmenden. Danach erfolgt aber eine 
Exploration der Daten über die Interaktion mit dem Diagramm: Es lassen sich 
Dialekträume ableiten bzw. interaktionslinguistische Phänomene entdecken, 
die erst sichtbar werden, weil mit dem Diagramm ein grafisches Relationssystem 
zur Verfügung steht, das in Analogie zu den Relationen im Sachverhalt steht und 
mit dem sozusagen dort schwer mögliche Operationen viel leichter im Diagramm 
durchgeführt werden können. Im besten Fall führen diese Operationen schließ- 
lich zu neuen Erkenntnissen. 
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Gerade vor dem Hintergrund algorithmisch erstellter Diagramme stellt sich 
jedoch die Frage, auf welcher Ebene das Operieren mit dem Diagramm beginnt. 
Eine digitale, interaktive Karte scheint ein Prototyp für ein operatives Diagramm 
zu sein: Es ist möglich, den Ausschnitt zu verschieben, zu zoomen, Distanzen 
zwischen Punkten zu berechnen oder sich eine Weganleitung ausgeben zu 
lassen. Ein anderes Beispiel ist eine digitale Dialektkarte, auf der Datenpunkte 
mit bestimmten Ausprägungen ein- und ausgeblendet, ihre Darstellung verän- 
dert oder Werte aggregiert werden können. Auf den ersten Blick scheint Interak- 
tivität in digitalen Diagrammen deckungsgleich mit diagrammatischer Operatio- 
nalität zu sein. Allerdings muss Folgendes bedacht werden: Operationalität muss 
nicht zwingend auch Interaktivität bedeuten. Auch und vor allem kann auch mit 
einem auf Papier gezeichneten Diagramm operiert werden. Das gilt beispiels- 
weise deutlich für geometrische Beweisbilder, wie etwa in der bekannten Darstel- 
lung in Platons Menon: Die Aufgabe, die Menon seinem Sklaven stellt, besteht 
darin herauszufinden, was getan werden muss, um die Fläche eines Quadrates 
zu verdoppeln. Die Argumentation geschieht diagrammatisch, indem zunächst 
ein Quadrat gezeichnet wird: 


Der erste Gedanke besteht darin, die Seitenlängen des Quadrates zu verdoppeln. 


Es wird aber sofort klar, dass damit eine vierfache Fläche des ursprünglichen 
Quadrates erreicht wird. 


Diagramme — 27 


Die vierfache Flache ist aber doppelt so viel als gewiinscht. Daher liegt es nahe, 
von jedem der vier entstandenen Quadrate nur die Halfte zu verwenden und 
daher in jedes eine Diagonale zu ziehen. Daraus ergibt sich ein Quadrat mit dop- 
pelter Flache des Ursprungsquadrates: 


N 


Damit wird auch deutlich, dass die Diagonale im Quadrat die entscheidende 
Länge ist, um die neuen Seitenlängen des doppelt so großen Quadrates zu 
bestimmen. 

Damit ist zeichnerisch, eben diagrammatisch, gezeigt, wie die Aufgabe gelöst 
werden muss. Dafür musste mit dem Diagramm operiert werden. 

Zweitens ist Operationalität nicht mit Interaktivität gleichzusetzen, da beim 
algorithmisch erstellten Diagramm zwingend bereits mit der Darstellung des Dia- 
gramms verbundene Operationen stattfinden, die ebenfalls zur Operationalität 
des Diagramms gezählt werden müssen. Diese Fragen sollen in Kapitel 4 ausführ- 
lich diskutiert werden. 


Medialität: Schließlich betont Krämer die Medialität von Diagrammen, da diese 
eine Mittlerstelle zwischen heterogenen Sphären (Anschaulichem und Begriffli- 
chem) einnehmen und eine Vermittlungsarbeit leisten, indem sie einen „Nexus 
zwischen dem Verschiedenen [schaffen], ohne dessen Divergenz dabei aufheben 
zu müssen“ (Krämer 2016, 85). 

Ich werde in Abschnitt 3.1 versuchen, diesen Aspekt der Medialität mit 
Ludwig Jägers Transkriptivität zusammenzubringen, denn mir scheint, bei dia- 
grammatischen Verfahren im Kontext von Sprachdaten lohnt ein genauerer Blick 
auf die semiotischen Prozesse, die sich hier abspielen. Sprachliche Symbole sind 
ein eigensinniges Medium - sie sind eine „Möglichkeitsbedingung der Sinnbil- 
dung selbst“ und kein Mittel der Übertragung (Jäger 2005, 53) -, das rekursive 
Transkriptionen als wesentliches Verfahren „zur Prozessierung sprachlichen 
Sinnes“ ermöglicht (Jäger 2005, 58). 
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Die zwölf Eigenschaften erfassen das Diagrammatische und sind auch für meine 
weiteren Uberlegungen leitend, da sich an ihnen verschiedene Aspekte genauer 
untersuchen lassen, wenn es sich um die diagrammatische Praxis in der Lingu- 
istik handelt. Die Eigenschaften erklären aber noch nicht genau, wie durch das 
Operieren mit und in Diagrammen neues Wissen und neue Einsichten entstehen, 
wie es als „Denkzeug“ funktioniert. „Wie das möglich ist, ist eine Kardinalfrage 
der Diagrammatologie“ (Krämer 2016, 85) und Krämer beschreibt im Folgenden 
dieses Phänomen als „kartographischen Impuls“: 


Das wesentliche Motiv unserer Parallelführung geographischen und epistemischen Orien- 
tierens in Form eines kartographischen Impulses ist es, auf die grundlegende Bedeutung 
des Handlungsaspektes aufmerksam zu machen: Diagramme können nicht auf ihre schau- 
bildliche, illustrierende Funktion und damit auf ihr Visualisierungsprotenzial beschränkt 
werden. (Krämer 2016, 90) 


Um Diagramme als Parallelführung diagrammatischen und epistemischen Orien- 
tierens und als Werkzeug für das „Handwerk des Geistes“ aufzufassen, müssen 
sie in ihrer Materialität und im Handlungskontext gesehen werden. Krämer nennt 
das die „materiale, konkrete Zuhandenheit von Diagrammen“: 


Visualisiert werden kann fast alles, und dies auch noch in vielen unterschiedlichen Weisen. 
Wenn Diagramme eine geistige Orientierungstechnik sind, wenn sie zum „Handwerk des 
Geistes“ avancieren, dann ist die ihnen eigene Art von Sichtbarmachung abhängig von 
ihrer operativen Funktion, und diese wiederum schließt auch die materiale, konkrete 
Zuhandenheit von Diagrammen ein - und zwar im nahezu buchstäblichen Sinne: Die der 
geographischen Bewegungsorientierung dienenden Orientierungskarten sind — meistens — 
durch Handlichkeit ausgezeichnet; sie sind in das Terrain unschwer transportierbar und 
können körpernah entfaltet werden. Nicht zufällig also erweist sich das Smartphone in 
seiner unauffälligen Mobilität als ideales Navigationsgerät. (Krämer 2016, 90) 


Entscheidend für Diagramme ist einerseits also ihre Materialität und die damit 
verbundene Zuhandenheit, andererseits ihre Abbildfunktion, die eine Parallel- 
führung von Operieren im Geist und Operieren im Diagramm ermöglicht. 
Zunächst möchte ich den ersten Gedanken, die „materiale, konkrete Zuhan- 
denheit von Diagrammen“ etwas ausführen: Dieser Gedanke betont die Bedeu- 
tung der Materialität des Diagramms im Zusammenspiel seiner Handhabung, 
also der Benutzungspraxis. Krämer verweist auf das Smartphone als Navigations- 
gerät, das in Verbindung mit der Kartendarstellung spezifische diagrammatische 
Operationen erlaubt, wofür dessen Handlichkeit, kombiniert mit spezifischen 
technischen Funktionen, verantwortlich ist. Zum Diagramm gehört also eine von 
Materialität abhängige Praxis, die es erst zum „Handwerk des Geistes“ machen. 
Materialität und Zuhandenheit sind aber auch auf der Seite der Produktion von 


Diagramme — 29 


algorithmisch, digital erstellen Diagrammen entscheidend: Die operativen Funk- 
tionen eines Diagramms schließt auch die bei dessen Entstehung wirksame 
Codierungspraxis mit ein, also die Wahl einer bestimmten Programmierumge- 
bung und einer Programmiersprache, die eingebettet sind in eine spezifische 
Praktik. Ich werde diese Praktik als ‚Coding Culture‘ konzipieren und beschreiben 
(vgl. Abschnitt 4.4). 

Der zweite Gedanke ist die Abbildfunktion von Diagrammen, die mit den 
zwölf Eigenschaften von Diagrammen, wie oben erläutert, schon deutlich gewor- 
den ist. Diese „Abbildfunktion“ kann jedoch nicht als platte ikonische Abbildung 
verstanden werden, sondern als „medientechnische Metamorphose“ (Krämer 
2016, 113). Das Zustandekommen einer solchen medientechnischen Metamor- 
phose wurde bereits in Plinius‘ Butades-Legende thematisiert: Nach der Legende 
zeichnet die Tochter des Butades das Schattenbild ihres sie verlassenden Gelieb- 
ten auf der Wand nach und Butades füllt den Umriss danach mit Ton reliefartig 
auf. Damit kommt eine medientechnische Metamorphose zustande (vgl. Krämer 
2016, 111 für eine ausführliche Diskussion der Butades-Legende). Der Schatten ist 
nicht einfach natürlicher Index des Körpers, sondern Ausdruck einer bestimm- 
ten Projektionsmethode (abhängig vom Standort und der Art der Lichtquelle). 
Der Rand des Schattens wird dann als Projektionslinie aufgefasst - aber auch 
dann ist die Handlung nötig: Die Handlung, mit einem Stift die Projektionslinie 
als Spur aufzufassen und ihr zu folgen: 


Abbildung ist nicht einfach die Verbildlichung von Nichtbildlichem, sondern ist die Über- 
tragung einer Darstellungsweise in eine andere Darstellungsform. Das macht uns zum 
Zeugen einer medientechnischen Metamorphose: Der flüchtige Schatten kondensiert zur 
dauerhaften Zeichnung. (Krämer 2016, 113) 


Das Beispiel zeigt auch, wie Entwurfslinie (Kontur des Schattens) und Objektli- 
nie (nachgezeichnete Linie) zusammenspielen, um das Diagramm erstellen zu 
können. 

Diese Überlegungen machen aber auch deutlich: Diagramme müssen in ihrer 
medialen Umgebung und als Ergebnisse verschiedener medientechnischer Meta- 
morphosen oder Transformationen gelesen und zusammen mit einer diagram- 
matischen Praxis betrachtet werden. Wenn man sich vergegenwärtigt, dass die 
meisten Diagramme in den Wissenschaften auf algorithmischem Weg entstehen, 
gesellen sich zu den medialen Ebenen bei auf analoge Weise erstellten Diagram- 
men noch eine Reihe von weiteren Ebenen und Operationen im digitalen Raum 
hinzu. Es sind dies die folgenden Elemente: 

- Der Computer als diagrammatische Maschine: Damit ein Diagramm auf 
einem Bildschirm sichtbar wird, sind eine Reihe von algorithmischen Ope- 
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rationen nötig, die ebenfalls als mediale Transformationsprozesse aufgefasst 
werden können. Der Computer ist dabei aber nicht einfach vernachlässigba- 
res Element eines Preprocessings, sondern elementar in diagrammatische 
Operationen eingebunden. Ich werde daher in Kapitel 4 dafür plädieren, 
Computer als diagrammatische Maschinen aufzufassen. 

- Coding Cultures: Wenn man die These akzeptiert, den Computer als diagram- 
matische Maschine und damit als Bestandteil diagrammatischen Operierens 
aufzufassen, verdient Code, als Ausdruck von Algorithmen, eine genauere 
Betrachtung. Dabei möchte ich Code nicht einfach als abstraktes semioti- 
sches System auffassen, sondern als eingebettet in Praktiken des Codierens. 
Genau so wie die Strichführung, der sich bewegende Stift, bei der Erstel- 
lung von und der Arbeit mit Diagrammen entscheidend ist, ist das auch das 
Handeln mit Code, also das Codieren (und weniger der Code selbst) — genau 
so wie die Praxis des Zeichnens (und weniger der Stift) für „analoge“ Dia- 
gramme relevant ist. Ich möchte dafür einen Blick auf das werfen, was ich 
„Coding Cultures“ nenne (Abschnitt 4.4). 


Diese Auslegeordnung des ‚Diagrammatischen‘ dient nun dazu, die Extension 
von ‚Diagramm‘ für die vorliegende Arbeit genauer zu bestimmen und Begriffsde- 
finitionen vorzunehmen. 


2.2.3 Definitionen: Diagramm, diagrammatisch, Visualisierungen, Praktiken 
und Denkstile 


Die bisherigen Ausführungen machten deutlich, was die entscheidenden Merk- 
male von Diagrammen sind. Mit Krämer gesprochen, erzeugen Diagramme ein 
grafisch dargestelltes System von Relationen in der Fläche, das als Schematisie- 
rung und mit Referenzbezug auf diagrammexterne Sachverhalte aufgefasst wird. 
Mit solchen Diagrammen kann operiert werden, indem die darin dargestellte 
Information nach der Logik des Diagramms gelesen und verändert wird, um 
neue Erkenntnisse über die Sachverhalte zu gewinnen. Dank ihres Schematismus 
lassen sie sich vom Einzelfall lösen und erzeugen Sozialität, sind also Teil einer 
kulturellen Praktik und organisieren geteilte epistemische Erfahrung. 

Wenn man diesem Diagrammbegriff folgt, gehören die bereits von Jacques 
Bertin in seiner „S&miologie Graphique“ (1967) genannten Gruppen, „les dia- 
grammes“, „les réseaux“ und „la cartographie“ (jeweils mit Untergruppen) 
zweifellos dazu. Die drei Typen lassen sich präzise bezüglich den unterschied- 
lichen Relationen zwischen den Komponenten unterscheiden: Diagramme sind 
dadurch charakterisiert, dass sie Relationen zwischen einer und mindestens 
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einer anderen Komponente herstellen, etwa wenn der Börsenkurs als Abhängig- 
keit der Komponente Zeit zur Komponente Preis der Aktie dargestellt wird (Bertin 
1967, 50). Bei Netzen wiederum werden Relationen zwischen Ausprägungen oder 
Teilen derselben Komponente dargestellt. Bertin nennt als Beispiel eine Gruppe 
von Individuen A, B, C, ... (Komponente Individuen) und möglichen Gesprächen 
zwischen den Individuen: Potenziell kann jedes Individuum mit jedem anderen 
sprechen (Ausprägung der Komponente als Kommunikationsverhalten eines 
Individuums). Ein Netz, das dargestellt, wer mit wem spricht, stellt also Relatio- 
nen zwischen Teilen oder Ausprägungen derselben Komponente dar (Bertin 1967, 
50). Bei Karten sind ebenfalls Relationen zwischen Teilen oder Ausprägungen 
derselben Komponente möglich, allerdings geordnet nach einem geografischen 
Referenzsystem (Bertin 1967, 51). Bertin nennt im Anschluss an diese Systematik 
noch Symbole als vierte Gruppe, wobei hier die Relation nicht auf einer Fläche 
zustande kommt, sondern zwischen dem Zeichen und der Leserin/dem Leser 
(Bertin 1967, 51). 

Mir scheint es aber gewinnbringend, den Diagrammbegriff noch weiter zu 
fassen und die diagrammatisch orientierte Anordnung von Elementen auf einer 
Fläche ganz generell ebenfalls darunter zu subsumieren. Ein Beispiel dafür sind 
Listen und Tabellen, die gänzlich ohne grafische Auszeichnungen auskommen 
und nur mit sprachlichen Zeichen arbeiten können. Sie heben sich jedoch etwa 
von Fließtext ab, da sie sprachliche Zeichen (erste Komponente) in Relation zu 
einer Anordnung in der Fläche (zweite Komponente) setzen, mit dem Ziel, ein 
diagrammatisches Schema aufzurufen: Bei einer Liste ist es das Schema der 
Reihung von Elementen, die sogar bei Listen mit Einrückungen oder bei Tabel- 
len eine Hierarchie abbilden kann. Martin Steinseifer (2013) plädiert dafür, aus 
textlinguistischer Sicht Texte generell mit einem diagrammatischen Blick zu 
analysieren, um den Beitrag der visuellen Gestalt von Texten zur „Bildung und 
Konturierung des spezifischen Sinnzusammenhangs“ zu würdigen (Steinseifer 
2013, 34). Bereits typografische Auszeichnungen wie Überschriften haben solche 
ordnende Wirkung, weit mehr gilt das aber für 


sprachlich kompakte, visuell geprägte Textformen wie Listen und Tabellen, denn sie erlau- 
ben als visuelle Anordnungsschemata die für diagrammatische Phänomene charakteristi- 
sche operativ-flexible Kohärenzbildung. Bei der Rezeption legen sie einen Sinnzusammen- 
hang nahe, der zugleich je nach Nutzungsziel auf sehr verschiedene Weise entfaltet werden 
kann. (Steinseifer 2013, 34) 


Offensichtlich ein visuelles Anordnungsschema in Texten sind beispielsweise 
Inhaltsverzeichnisse, die einerseits den selektiven Zugriff auf Textteile ermögli- 
chen, oft aber ein „Modell des Textes“ sind, um die „für eine sinnvolle Nutzung 
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der Zugriffsmöglichkeiten [auf das Buch, NB] nötige Orientierung zu bieten“ 
(Steinseifer 2013, 30). 

Vor dem Hintergrund der vorliegenden Arbeit ist diese textlinguistische Pers- 
pektive ein Spezialfall. Wenn es aber darum geht, sprachliche Daten diagramma- 
tisch aufzubereiten, sind Listen und Tabellen aber zentrale Diagrammformen, die 
ich unter den Diagrammbegriff fassen möchte. 

Eine weitere Diagrammform, die mit Listen und Tabellen verwandt ist, sind 
Partituren und partiturartige Darstellungen, bei denen z.B. in Gesprächstran- 
skripten die Gleichzeitigkeit von sprachlichen Äußerungen abgebildet wird. 
Auch diese Form erfüllt nach meiner Auffassung die Definitionskriterien des 
Diagramms, da sie ebenso ein Relationensystem von sprachlichen Einheiten 
als Anordnung auf einer Fläche schematisiert und dies ja insbesondere tut, um 
Operationen mit diesen Daten zu erlauben. Im Fall der Gesprächsanalyse wird 
gesprochene Sprache überhaupt erst analysierbar durch diese Art der diagram- 
matischen Verschriftlichung. 

Während Listen, Tabellen, Partituren und ähnliche Formen am Übergangs- 
bereich zwischen Diagramm und Text stehen, bewegen sich bildgebende Ver- 
fahren wie Röntgen- und Ultraschallbild sowie Computertomographie und viele 
weitere Darstellungen im naturwissenschaftlichen, insbesondere medizinischen 
Bereich, im Übergangsbereich zwischen Diagramm und Fotografie. Am Anfang 
von bildgebenden Verfahren stehen Messungen, die ausgewertet und als Bild 
dargestellt werden. Wie ich in Abschnitt 2.3.2 zeigen werde, suggerieren solche 
Visualisierungen ein einfaches Abbildverhältnis zwischen Gegenstand und Bild, 
tatsächlich stehen jedoch meist komplexe Berechnungen und Modellierungen 
zwischen Messdaten und Bild. Auch solche Visualisierungen zeigen deutlich dia- 
grammatische Züge, da sie mit grafischen Mitteln Information so codieren, dass 
sie schematisch gelesen und über Operationen interpretiert werden können. Fast 
immer werden sie zudem mit Achsen oder anderen diagrammatischen Referenz- 
systemen kombiniert, so dass sie ähnlich wie eine Karte als diagrammatisches 
Werkzeug verwendet werden können. 

Bildgebende Verfahren spielen in der Linguistik eine untergeordnete Rolle, 
erhellend sind aber die bildwissenschaftlich und historischen Zugänge zur 
Analyse solcher Visualisierungen, um generell den Zusammenhang zwischen 
Wissenschaftspraktiken und Diagrammen zu verstehen. 

Die oben mit Steinseifer zitierte textlinguistische Sicht auf das Diagram- 
matische in Texten zeigt bereits, dass keine trennscharfe Unterscheidung von 
Diagramm und Nicht-Diagramm gezogen werden kann. Das liegt insbesondere 
auch daran, dass Diagramme in eine kulturelle Praxis eingebunden sind und 
dort eben als Diagramm aufgefasst werden. Diese kulturellen Praktiken sind 
unsystematisch und kontextabhängig. Deswegen ist es sinnvoll, neben dem Dia- 
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grammbegriff auch den Begriff des Diagrammatischen zu verwenden, um deut- 
lich zu machen, dass ein bestimmtes Phänomen eine diagrammatische Wirkung 
entfalten kann, ohne gleich als prototypisches Diagramm aufgefasst werden zu 
müssen. 

In der vorliegenden Arbeit werde ich wiederholt auch von Visualisierungen 
sprechen und meine damit alle Formen von bildlichen Darstellungen in den Wis- 
senschaften. Damit sind also im engeren Sinn Diagramme, aber auch die im wei- 
teren Sinn diagrammatisch verwendeten Darstellungen gemeint. 

Schließlich möchte ich auf die für mich zentralen Konzepte der Praktiken 
und Denkstile zu sprechen kommen. Ich verstehe mit Stephan Habscheid Prak- 
tiken als 


Prozesse verkörperten Betragens [...], deren jeweiliger Sinn ganz oder zu (großen) Teilen auf 
einem durch Handeln präsupponierten Hintergrund von für selbstverständlich gehaltenen 
Gegebenheiten beruht. Mit anderen Worten möchte ich Praxis als Bedingung für Handeln 
verstehen und Handeln als ein mögliches Element von Praxis. (Habscheid 2016, 137) 


Habscheid engt in der Folge weiter ein und spricht von „kommunikativen Prak- 
tiken“, die in einer „allgemeinen ‚Infrastruktur‘ zwischenmenschlicher Inter- 
aktion verankert sind“ und die „aufgrund situierter Zeichenverwendung als 
Handeln - und damit als Praxis — verständlich werden“ (Habscheid 2016, 137). 
Der Praktikenbegriff bildet demnach einen Deutungshorizont für die - in meinem 
Fall — Analyse der Verwendung von Diagrammen in der Linguistik. Bestimmte 
Verwendungsweisen oder Bedeutungen von Diagrammen können also vor dem 
Hintergrund genereller Praktiken gedeutet werden und das Ensemble der Verwen- 
dungsweisen in einer wissenschaftlichen Disziplin kann als wissenschaftliche 
Praxis oder Forschungspraxis des Umgangs mit Diagrammen aufgefasst werden. 

Für den Fokus auf Wissenschaftspraktiken kann der Denkstil-Begriff von 
Ludwik Flecks Erkenntnistheorie (1980) fruchtbar gemacht werden, die davon 
ausgeht, dass man als Wissenschaftlerin oder Wissenschaftler in ein Denkkollek- 
tiv eingebunden ist, in dem ein bestimmter Denkstil herrscht und der die eigene 
Arbeit und die möglichen Deutungen und Erkenntnisse leitet. In Abschnitt 3.2 
werde ich diagrammatische Praktiken vor dem Hintergrund solcher Denkstile zu 
beschreiben versuchen. Auf den feinen Unterschied zwischen Forschungsprak- 
tiken und Denkstilen macht Nina Kalwa (2018, 219) aufmerksam. Sie versteht 
in Abgrenzung zum Praktikenbegriff unter Denkstil „die in einer bestimmten 
wissenschaftlichen Disziplin für selbstverständlich gehaltenen Gegebenheiten“ 
(Kalwa 2018, 219). Der Denkstil wirkt sich dann auf die Praktiken aus, allerdings 
implizit, eng mit der Praktik verwoben. „Solche impliziten Annahmen, die in 
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wissenschaftlichen Praktiken zum Ausdruck kommen, werden hier als Denkstile 
bezeichnet“ (Kalwa 2018, 219). 

So ist etwa die diagrammatische Praxis in der linguistischen Gesprächsana- 
lyse, insbesondere was die Verwendung von bestimmten Formen der Transkrip- 
tion betrifft, Ausdruck impliziter Annahmen, die als spezifischer Denkstil aufge- 
fasst werden können. Diesem Denkstil liegt beispielsweise eine quantitative Sicht 
auf gesprochene Sprache eher fern und er geht davon aus, dass sich in der einzel- 
nen Interaktion prinzipiell alles zeigt, was auch auf abstrakter Ebene interessiert. 

Nachdem wir nun eine Orientierung über die zentralen Elemente einer 
Diagrammatik und die damit einhergehenden Definitionen für die vorliegende 
Arbeit haben, möchte ich im Folgenden auf die Besonderheiten von Diagrammen 
im Kontext der Wissenschaften zu sprechen kommen, bevor ich dann auch auf 
Diagramme in der Linguistik eingehe. 


2.3 Wissenschaftliche Visualisierungen 


Take a fantastic journey through the human body, thanks to the magic of technology and the 
most spectacular microscopic images ever created. These pictures, as beautiful as any art, 
provide a window into the wonder of our brains, the work of a white blood cell, the power 
of hormones, the tiny hairs on our arms, the movement of human cancer cells, the jagged 
edges of caffeine crystals, and more. Enjoy the collection purely as a visual voyage or as a 
means of understanding the science behind the images—which all include the scale of the 
photography as well as the scientific details in layman’s terms. (Salter 2014, Klappentext) 


Dies ist der Klappentext des Buches ,,Science is Beautiful: The Human Body 
Under the Microscope“. Es enthält hauptsächlich Micrographien des mensch- 
lichen Körpers, also hochauflösende, mikroskopische Fotografien. Der Werbe- 
text preist die ‚magische Technologie‘, die eine ‚fantastische Reise‘ durch den 
menschlichen Körper ermögliche; die Bilder seien ‚schön wie Kunst‘ und geben 
einen ‚Einblick‘ in die ‚Wunder‘, die ‚Arbeit‘, die ‚Kraft‘ etc. des menschlichen 
Körpers. Man könne das Buch sowohl als ‚visuelle Reise genießen‘, als auch etwas 
lernen über ‚die Wissenschaft hinter den Bildern‘. 

Der Text ist symptomatisch für die populärwissenschaftliche Kontextualisie- 
rung wissenschaftlicher Visualisierungen und ist geprägt durch einen Diskurs, 
der naturwissenschaftliche Forschung idealisiert. Der Text steht dabei im Kon- 
trast zur Eigenperspektive vieler (naturwissenschaftlicher) Disziplinen, die ein 
äußerst pragmatisches Bild der Rolle von Visualisierungen entwirft, die dort 
„ganz normale Bilder“ (Gugerli/Orland 2002, 9) seien: 
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Der vorherrschende Anspruch an naturwissenschaftliche Bilder ist, dass sie keine reinen 
Schöpfungen des menschlichen Geistes sind, sondern auf Naturerkenntnis oder Natur- 
beobachtung verweisen. Von ihnen wird eine begründete Referenz auf eine Theorie und 
auf einen Wissensdiskurs erwartet, weil naturwissenschaftlichen Bildern und Objekten 
Evidenz unterstellt wird. Sie zeigen etwas oder machen etwas sichtbar, das sowohl außer- 
halb ihrer selbst existiert als auch durch sie entsteht (Werner 2008, 30). 


Die nüchterne Schilderung schmälert den wissenschaftlichen Wert von Visuali- 
sierungen natürlich nicht, doch die Methoden ihrer Hervorbringung sind nicht 
„magisch“, jedoch äußerst komplex, und die entstehenden Bilder sind nicht 
Kunst: 


Nichts spricht dafür, daß zum Beispiel Röntgenaufnahmen Kunstwerke sind, auch wenn 
sich verschiedene historische Stile an ihnen unterscheiden lassen. Viel dagegen spricht 
dafür, die bildnerischen Strategien, wie sie durch veränderte Apparate erzeugt wurden, zu 
unterscheiden, insgesamt: Kriterien dafür zu entwickeln, wie Bilder funktionieren, wenn es 
um anatomische Darstellungen, um Entwurfskizzen oder um Gemälde des gleichen Sach- 
verhaltes geht. (Böhm 2001, 44) 


Böhm formuliert also ein Forschungsprogramm aus kunsthistorischer Sicht, 
das die Funktionsweise von wissenschaftlichen Visualisierungen in den Blick 
nehmen soll. Ob die Mittel ihrer Hervorbringung dann als „magisch“ oder einfach 
als „komplex“ angesehen werden, gibt einen Hinweis auf die Einbettung in den 
jeweiligen sozialen Kontext, in dem über die Visualisierungen gesprochen wird. 

Im Folgenden möchte ich wissenschaftliche Visualisierungen aus vier Per- 
spektiven thematisieren, ohne einen vollständigen geschichtlichen Abriss 
anstreben zu wollen (vgl. dafür z.B. Friendly 2008; Tufte 1983): 1) Ein Blick in 
die Geschichte der Visualisierung zeigt die Bedeutung von Diagrammen für neue 
Wissensordnungen im 16. Jahrhundert und die Entwicklung über statistische Dia- 
gramme zu den modernen Visual Analytics. 2) Die z.B. in der Medizin gängigen 
„bildgebenden Verfahren“ suggerieren einen Abbildcharakter der Visualisierun- 
gen, der in populärwissenschaftlichen Kontexten sowieso (vgl. den Klappentext 
oben: „These pictures [...] provide a window into [...]“), aber auch in Fachkontex- 
ten immer wieder angenommen wird - und falsch ist. 3) Gerade in den Wissen- 
schaften ist eine Analyse der Praxis des Umgangs mit Visualisierungen essentiell, 
um deren Funktion, z.B. in „Viskursen“ nach Karin Knorr Cetina (2001), zu ver- 
stehen. 4) Und schließlich zeigt der Klappentext oben auch sehr schön die große 
Rolle, die wissenschaftliche Visualisierungen in der nicht-wissenschaftlichen 
Öffentlichkeit spielen. 
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2.3.1 Visualisierungen zwischen Illustration und Instrument 


Zunächst lohnt ein Blick in die Geschichte der Organisation von Wissen. Steffen 
Siegel (2009) untersucht in seiner Arbeit mit den Tableaux von Christophe de 
Savigny (1587 erstmals erschienen) die damaligen diagrammatischen Strategien, 
um neue Wissensordnungen zu ermöglichen. 
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Abb. 4: Tafeln „Musique“ von Savigny (1587), Gallica, Bibliothèque nationale de France 


Savignys Ziel war es, das gesamte relevante Wissen auf 17 Tafelpaaren mit 31 mal 
40 cm zu ordnen. Dafür zeichnete er einerseits Diagramme in Form von synopti- 
schen Begriffsdiagrammen, die durch eine Texttafel ergänzt werden (vgl. Abbil- 
dung 4 für die Beispielseite zu „Musique“). Savigny unternahm also 


den anspruchsvollen Versuch, auf jeweils einem Tafelpaar eine übersichtliche, leicht fassli- 
che und zugleich möglichst erschöpfende Darstellung der betreffenden Disziplin vor Augen 
zu stellen. Als Rezipient von Savignys Tafelwerk diesem Anspruch zu folgen heißt, die Akte 
des Betrachtens sowie des Lesens aufeinander zu beziehen. Das hierbei in Gang gesetzte 
Zusammenspiel sichtbarer und lesbarer Zeichen, so lautet die diesem Tafelwerk vorausge- 
setzte Annahme, arbeitet der Möglichkeit zu, Ordnungen des Wissens durch einen kom- 
binatorischen Gebrauch von Diagramm, Bild und Text zu konstruieren und vor Augen zu 
stellen. (Siegel 2009, 17) 
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Siegel zeigt, dass es im 16. Jahrhunderte verschiedene Ansätze gab, solche Enzy- 
klopädien zusammenzutragen und dafür neue Ordnungssysteme zu finden. Das 
Exzerpieren und das Anlegen von Zettelkästen sind noch heute Zeugen solcher 
Versuche, die mit einem neuen Lektüreverhalten einher gehen, mit dem Fund- 
orte, „Loci“, in verschiedenen Quellen, zusammengefügt und in neue Ordnungen 
gebracht werden. Dafür sind grundsätzliche diagrammatische Operationen der 
Listenbildung, Tabellierung, Vernetzung etc. im Spiel. Man kann diese Verknüp- 
fung von diagrammatischen Operationen mit Lektüreverhalten als Höhepunkt 
einer „humanistischen Gelehrsamkeit“ (Siegel 2009, 47) deuten, die bis in die 
Antike zurückreicht: 


[Glerade mit dieser strikten Reduktion des visuellen Vokabulars schließen Savignys Tab- 
leaux an eine diagrammatische Zeichenpraxis an, die aus jenen seit der Antike tradierten, 
insbesondere der aristotelischen Philosophie verpflichteten terminologischen Stemmatisie- 
rungen hervorgegangen war, im Lauf des 16. Jahrhunderts zu einer spezifischen diagram- 
matischen Methodik weiterentwickelt worden ist und spätestens in dessen zweiter Hälfte 
für die humanistische Aufzeichnungs- und Darstellungspraxis in den Rang einer offenbar 
kaum verzichtbaren Form der Visualisierung aufsteigen konnte. (Siegel 2009, 56) 


Die Stemmatisierung, also die Abbildung disziplinären Wissens in einem Begriffs- 
baum, ist also die diagrammatische Grundfigur, die Savigny und andere nutzen. 
In der Linguistik sind uns Stemmata natürlich wohlbekannt; bemerkenswert 
ist, wie universell diese Grundform eingesetzt wird, um völlig unterschiedliche 
Inhalte danach zu strukturieren. 

Die Tableaux von Savigny zeigen auch die Bedeutung des das Diagramm 
begleitenden Textes: ein Arrangement, das nicht suggeriert, das Diagramm könne 
für sich alleine stehen. Auch die anderen von Krämer genannten wichtigen Eigen- 
schaften von Diagrammen (vgl. Kapitel 2.2) sind deutlich gegeben, wobei Savigny 
seine Tableaux mit weiteren Diagrammtypen anreichert (Tafeln, Figuren etc.) und 
verziert. Siegel verweist mit Recht darauf, dass die Tableaux damit einem über- 
geordneten Schema folgen, nämlich einem komplexen Rahmenschema, das aus 
einem „Ring des Wissens“ (Illustration wichtiger Gegenstände im innersten Ring) 
und dem „Ornament als Grenze“ besteht (Siegel 2009, 175). Dies seien noch Anzei- 
chen für die Hoffnung, Wissen in seiner Gänze abbilden zu können, bis dann 
später an die Stelle „der humanistischen Idee von ‚Enzyklopädie‘ [ein] offenes, 
immer wieder neu zu definierendes Feld des Wissens“ (Siegel 2009, 154) trete. 

Dieses sich ständig wandelnde Feld des Wissens wird mit den klassischen 
Enzyklopädien, wie etwa der bekannten „Encyclopedie, ou dictionnaire raisonné 
des sciences, des arts et des métiers“ von Diderot und d’Alembert (1751), noch 
deutlicher. John Bender und Michael Marrinan (2014) beschreiben dies, indem sie 
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auf das Netz von Verweisen aufmerksam machen, das mit der Lektiire der Enzyk- 
lopädie, also dem Operieren mit ihr, entsteht: 


Die Tafeln der Enzyklopädie ordnen, so behaupten wir, Datenbündel in visuellen Verzeich- 
nissen, diein veränderlichen und labilen Verhältnissen zueinander wie auch zu tableauar- 
tigen, auf einen Einzelbetrachter ausgerichteten Weltsichten stehen. Diese Anordnungen 
verstreuter Informationen finden dadurch zu kognitiver Stabilität, dass ein Nutzer aktiv 
Korrelationen bildet, und zwar über das Weiße des Druckmediums hinweg, das sich als 
offener Raum verstehen lässt, als undurchdringliches Feld und unter Umständen als beides 
zugleich. Diese Wandelbarkeit möchten wir hervorheben, setzt sie doch voraus, dass ein 
Nutzer der Enzyklopädie, statt eine fixe Subjektivität zu besitzen[,] Teil eines dynamischen 
Bedeutungssystems ist. (Bender/Marrinan 2014, 87-88) 


Diagrammatische Darstellungen sind in solchen Enzyklopädien ein wichtiges 
Mittel der Wissensdarstellung und nicht bloße Illustration. Es finden sich Tafeln 
wie jene des „Patissier“ (vgl. Bender/Marrinan 2014, 29), die aus einem oberen 
(kleineren) und unteren Teil besteht. Im oberen Teil wird der Arbeitsraum einer 
Konditorei dargestellt, in dem elementare Arbeitssituationen simultan gezeigt 
werden. Da sind insgesamt elf Personen gleichzeitig mit verschiedenen Tätig- 
keiten zugange. In der unteren Hälfte der Tafel sind dann die wichtigen Instru- 
mente separat abgebildet, wobei eine Nummerierung der Objekte auf die glei- 
chen Zahlen im oberen Bild referiert. Während das obere Bild auf den ersten Blick 
einem nicht-diagrammatischen Bild gleicht, hat das untere deutlich diagramma- 
tischen Charakter. Die einzelnen Gegenstände sind durch Weißraum voneinan- 
der getrennt und zwar perspektivisch gezeichnet, jedoch nicht auf einen gemein- 
samen Fluchtpunkt ausgerichtet. Damit wird deutlich, „dass das Weiße der Seite 
weder Leere noch einen Raum bedeutet, sondern einfach ein materiales Weiß 
darstellt“ (Bender/Marrinan 2014, 30). Doch auch die obere Darstellung besitzt 
diagrammatischen Charakter, da die einzelnen Objekte und Tätigkeiten einer 
Ordnung folgen, die bestmögliche Übersicht über sie ermöglicht. Heute begeg- 
nen uns solche Diagramme in Infografiken oder in bestimmten „Wimmelbilder- 
büchern“ für Kinder, die dieses Schema kopieren und Vielfalt und Komplexitätim 
Kontext simulieren (Blick auf eine Kreuzung in einer Stadt) und daneben mit dem 
Hervorheben von Schlüsselelementen ordnen. 

Während die bisher diskutierten Diagramme dem Ziel folgen, Wissen auszu- 
breiten und zu ordnen, werden für die Wissenschaften eine andere Art von Dia- 
grammen immer wichtiger. Sie gehen einher mit Entwicklungen in der Geometrie 
und Mathematik. 1756 entwickelt Gaspard Monges seine Methode der „darstel- 
lenden Geometrie“, um praktische Konstruktionsprobleme zu lösen. Kern seiner 
Methode war die Idee, dreidimensionale Gegenstände auf Flächen zu projizieren, 
um sie dann geometrisch lösen zu können (Bender/Marrinan 2014, 181). Dies ist 
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ein eindriickliches Beispiel diagrammatischen Operierens, um neue Erkennt- 
nisse zu gewinnen. 

Bedeutend waren jedoch auch die Fortschritte in der Mathematik und der Ent- 
wicklung der Wahrscheinlichkeitsrechnung, die ihren Anfang mit Pierre-Simon 
Laplace in der Physik nahm. Es ging um die Frage, wie mit einem theoretischen 
mathematischen Modell die Wahrscheinlichkeit für empirische Beobachtun- 
gen vorausgesagt werden kann (Bender/Marrinan 2014, 186). So gelingt es 1846 
den Planeten Neptun optisch zu entdecken, indem von John Couch Adams und 
Urbain Le Verrier mittels mathematischer Analyse der Abweichungen der Bahn 
des Uranus die zu erwartenden Koordinaten berechnet worden sind (Bender/ 
Marrinan 2014, 189). 

Damit entwickelt sich eine neue, statistische Anwendung von Diagrammen, 
die umfangreiche Datensammlungen visualisieren und damit besser verstehbar 
machen. Einen genauen Ursprung solcher Anwendungen festzustellen ist schwie- 
rig, finden sich doch schon sehr früh Diagramme, die in diese Richtung weisen 
(vgl. dazu auch Friendly 2008). So etwa die von Michael Florent van Langrens 
1644 erstellte Grafik der Schätzungen verschiedener Astronomen zur Longitudi- 
nal-Differenz zwischen Toledo und Rom (Tufte 1997, 15). Sie ist als Zahlenstrahl 
ausgeführt, auf dem die verschiedenen Schätzungen markiert sind und so die 
Streubreite sichtbar wird. 

Bender und Marrinan bezeichnen jedoch die Arbeiten von Adolphe Quetelet 
aus den 1820er-Jahren als besonders bemerkenswert bezüglich statistischer 
Diagramme (Bender/Marrinan 2014, 192). Er interessierte sich für Korrelationen 
verschiedener demographischer Daten, z.B. zwischen Populationsgrößen und 
Sterbequoten in Gemeinden. Um die in Tabellen gesammelten Angaben von 
Mittelwerten und statistischen Abweichungen dazu in den einzelnen Provinzen 
interpretieren zu können, griff Quetelet auf die in der Physik gängigen Methoden 
zurück, Temperatur- und Luftdruckschwankungen in Kurven darzustellen: 


Quetelets metaphorische Bezugnahme auf Thermometer und Barometer ist aufschluss- 
reich. Sie zeigt, dass er Menschen betreffende Zahlenangaben unpersönlich interpretiert, 
als ob diese von Instrumenten aufgezeichnet worden wären. Seine Datenanalyse entspricht 
der eines Physikers. (Bender/Marrinan 2014, 194) 


Visualisiert wurde durch die statistische Wahrscheinlichkeitsrechnung erzeugte 
Daten von „Durchschnittsmenschen“, deren Eigenschaften und deren Korrela- 
tionen zwischen diesen Eigenschaften als Kurven in einem Koordinatensystem 
sichtbar werden. Mit diesen neuen Zugriffen auf Daten entwickelt sich eine große 
Vielfalt von grafischen Formen; auch William Playfair (1759-1823) war hier eine 
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wichtige Figur (Friendly 2008, 23). Er erfand einen großen Teil der heute nach wie 
vor gebräuchlichen Diagramme wie Linien- und Balkendiagramme. 

Es zeichnet sich jetzt ab, dass die diskutierten Diagramme zu Instrumen- 
ten geworden sind, mit denen bestimmte Fragestellungen beantwortet werden 
können. Dieses Prinzip stellt die „Visual Analytics“ ins Zentrum, indem sie Visua- 
lisierungen von Beginn an als Instrument konzipieren, mitdem unbekannteDaten 
betrachtet werden - gleichbedeutend mit einem Mikroskop in der Mikrobiologie, 
das die Disziplin überhaupt erst ermöglicht, indem es den Untersuchungsgegen- 
stand handhabbar macht und damit konstruiert. Die moderne Visual Analytics 
sehen Jean-Paul Benzécri (1973b, 1973a) und John Tukey (1977) als Begründer 
dieses Paradigmas. Benzécri und Tukey sprechen von „analyse des données“ 
bzw. „exploratory data analysis“. Ein Beispiel für eine explorative Datenanalyse 
ist das bekannte Beispiel der Cholera Karte von John Snow, die dieser während 
einer Cholera-Epidemie in London 1864 herstellte (Tufte 1997, 27). Um seiner 
Vermutung nachzugehen, dass die Cholera über eine Wasserpumpe verbreitet 
werden könnte, benutzte er eine Liste von 83 Cholera-Todesfällen und zeichnete 
die Wohnorte der verstorbenen Personen auf einem Stadtplan ein. Diese Dar- 
stellung zeigte dann deutlich, dass sich fast alle Todesfälle um eine der Wasser- 
pumpen in der Broad Street gruppierten und zeigte damit, dass diese verseucht 
war. Darüber hinaus konnte Snow dann auch beweisen, dass Cholera über ver- 
unreinigtes Wasser (und nicht etwa über die Luft) übertragen wird. Entscheidend 
für Snows Erfolg war die diagrammatische Lösung mithilfe seiner angefertigten 
Karte. Statt Zeitreihen der Anzahl Todesfälle pro Tag zu zeichnen, konstruierte 
Snow „a graphical display that provided direct and powerful testimony about a 
possible cause-effect relationship [...] [by rlecasting the original data from their 
one-dimensional temporal ordering into a two-dimensional spatial comparision 
[...]“ (Tufte 1997, 30). 

Das Beispiel verweist auf die wichtige Funktion des Operierens mit Diagram- 
men: Bestehendes Wissen (Todesfälle und Wohnorte) wird in eine diagrammati- 
sche Form gebracht, in der dann operiert wird, um neues Wissen zu generieren. 
Wichtig ist die vorgängige Umformung (Tufte: „recasting“) der Daten, mit der eine 
andere Dimension (der örtliche Bezug) betont wird. Mit Sibylle Krämer gespro- 
chen wird also ein anderes System der Relationalitat erzeugt (vgl. Abschnitt 2.2). 

Die moderne Visual Analytics profitiert von der umfassenden Computerisie- 
rung und Digitalisierung, arbeitet so mit sehr viel größeren Datenmengen und 
erstellt die Visualisierungen algorithmisch. Der im Zeitalter von „Big Data“ zu 
bewältigende „information overload“ und die Komplexität der Daten ist dann 
auch ein Leitthema der gegenwärtigen Visual Analytics-Forschung: 
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Visual analytics combines automated analysis techniques with interactive visualisations for 
an effective understanding, reasoning and decision making on the basis of very large and 
complex datasets. (Keim et al. 2010, 7) 


Die Nennung des ,,decision making“ in diesem Zitat zeugt vom pragmatischen, 
problemorientierten Charakter der Visual Analytics. Im modernen Gewand sind 
die Visual Analytics ein Ergebnis geheimdienstlicher und polizeilicher Bemühun- 
gen im Nachgang zu den Terroranschlägen in den USA am 11. September 2001. 
Das 2005 von Thomas und Cook erschienene Buch „Illuminating the Path“ gilt 
als eines der Initialwerke der Disziplin; es ist Ergebnis von vom US Deparment of 
Homeland Security finanzierten Projekten mit dem Ziel, fortgeschrittene Infor- 
mationstechnologien zu entwickeln, um die „homeland security mission“ zu 
unterstützen (Thomas/Cook 2005, i).? Einerseits erinnert dies an den Wunsch 
der Enzyklopädisten im 16. Jahrhundert, das gesamte verfügbare Wissen greifbar 
zu machen, andererseits kommt aber die Triebfeder des modernen Data Minings 
hinzu: In den (komplexen) Daten ist ein Schatz verborgen, den es zu heben gilt. 
Der Schatz ist dabei natürlich nicht immer golden, aber auf jeden Fall wichtig: 
„identifying a plot or threat that is hinted at, but not clearly communicated, by 
a small subset of the documents in the collection“ (Görg et al. 2014). Natürlich 
folgt die Visual Analytics nicht immer dem Paradigma des Findens von Nadeln 
im Heuhaufen — ein Paradigma das beispielsweise für Geheimdienste relevant 
ist, die aus Big-Data-Datenströmen die winzigen Spuren von Verdächtigen finden 
wollen. 

Ein anderes Paradigma sieht den Schatz eher als eine Art aus den Daten 
aggregiertes Wissen, das erst über die Visualisierung sichtbar wird - ich nenne 
es das Die-große-Antwort-Paradigma. Ein Beispiel dafür ist die Arbeit des Teams 
um den Kunsthistoriker Maximilian Schich (2014), der sich für kulturgeschichtli- 
che Fragen interessiert: Er visualisierte die Geburts- und Sterbedaten (Zeitpunkt 
und Ort) von Persönlichkeiten des kulturellen Lebens über mehrere Jahrhun- 
derte hinweg als Netzwerkgraph und zwar dergestalt, dass auf einer Karte jeweils 
Geburts- und Sterbeort eingetragen und durch einen Bogen verbunden sind. Die 
Karte kann für unterschiedliche Zeitabschnitte gezeichnet oder als Animation 
betrachtet werden. Schich konnte durch die Aufbereitung der Daten als Karte 
zeigen, wann welche kulturellen Zentren existierten. 

Interessant an dem Beispiel ist, dass die zugrunde liegenden Daten ver- 
gleichsweise banal sind, in ihrer Masse jedoch in Tabellenform nicht deutbar 


3 Im Original: „the development of advanced information technologies to support the homeland 
security mission“ (Thomas/Cook 2005, i). 
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sind. Erst die Überführung in eine visuelle Form ermöglicht (fast) auf einen Blick 
eine Deutung sowie einen Gewinn an neuem Wissen. 

Interessant ist jedoch auch ein weiterer Aspekt: Neben den wissenschaft- 
lichen Publikationen zu dieser Arbeit existiert ein Video, das die Zeitschrift 
„Nature“ produziert hat (vgl. Abbildung 5).“ Es ist eine populärwissenschaftlich 
aufbereitete Präsentation dieser Graphdarstellung in animierter Form, um die 
Entwicklung der kulturellen Zentren sehen zu können. 


naturevide 


Abb. 5: Nature-Video zu Maximilian Schichs Network Framework of Cultural History (vgl. https:// 
youtu.be/4gIhRkCcDAU, letzter Zugriff: 22.9. 2020) 


Das Video ist mit Musik hinterlegt und wird von einer Frauenstimme kommen- 
tiert. Um die Natur der Daten zu erklären, beginnt es mit einem Einzelbeispiel, 
mit Leonardo Da Vinci (noch ohne Hintergrundmusik). Es wird gezeigt, wie die 
Datenpunkte von Geburtsort und Sterbeort visualisiert werden. Danach werden 
weitere Datenpunkte gezeigt und dazu kommentiert: 


Leonardo da Vinci is one of over a hundred thousand notable people who’s birth places and 
deathbeds have been mapped in this animation. It’s the work of a team lead by Maximilian 
Schich based at the University of Texas. The team wanted to chart hundreds of years of 
culture. Births are blue, deaths are red. 


4 Vgl. https://youtu.be/4gIhRkCcD4U (zuletzt aufgerufen: 22. 9. 2020). 
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Damit setzt auch Musik ein, schnelle pointiert gespielte Töne eines Klaviers, die 
als klangliche Entsprechung der vielen Datenpunkte verstanden werden können. 
Im Kommentartext wird bereits das oben erwähnte Die-große-Antwort-Paradigma 
der Visual Analytics deutlich: Nichts weniger als „Hunderte Jahre Kultur“ wird in 
unter sechs Minuten visualisiert. 

Der weitere Kommentar ist hochgradig narrativ: mit den Daten werden ein- 
zelne Geschichten erzählt: 


[...] Cultural sub-centers began to emerge, like Cordoba in Spain and Paris and Avignon 
in France. From the twelfth century onwards all roads no longer lead to Rome. Migration 
between other places are common. 


Auffallend ist auch der darauf folgende Vergleich mit einer anderen bekannten 
Visualisierung: 


It’s a little like a map of budget’s airlines destinations. 


Die Dokumentation wird in narrativem Ton weitergefiihrt, indem sie mit Wen- 
dungen wie „As times go on“ arbeitet, die in ihrem Charakter an „Once upon a 
time“-Kodierungen von Märchenerzählungen erinnert: 


As times go on, we can see that Paris attracts far more migrants than other french cities, 
whereas in Germany several cities compete evenly for migrant’s attention. [...] In the sixteen 
hundreds, many european born explorers looked west striking out to the Americas. Among 
them a fur trader originally from the english country side, governors from Spain and France 
looking after islands in the West Indies, and military men. These are early settlers and mil- 
itary folk. 


Die Darstellung andert hier leicht, indem die Kanten zwischen den Knoten mit 
den Namen der Personen beschriftet werden und eine perspektivische Darstel- 
lung gewählt wird, als ob man, im Flugzeug sitzend, auf Amerika zufliegen würde 
und links, rechts und vor einem die anderen Personen vorbeiziehen sehen würde: 


You might recognize some of these names. On the left, there goes John Washington, great 
grand-father of George Washington, the first president of the United States. [...] 


Der Ausdruck „On the left“ erinnert an die Kommentare von Sightseeing-Touren. 
Später wird die Besiedlung der Westküste der USA erzählt: 


From the eighteenth century onwards, gradually, look how people are starting to move to 
the West coast, living out their days there. [...] Transport links made it easier to get from the 
one coast to the other. First trains, then affordable cars. 
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Die ,,transport links“ werden sichtbar, indem man eine Reihe von Knoten in Linie 
in Bewegung von Ost nach West ziehen sieht. 

Die Dramaturgie des Videos bedient das Die-große-Antwort-Paradigma in 
bester Weise, indem in die eigentlich banale Darstellung der Datenpunkte bedeu- 
tende Geschichten interpretiert und erzählt werden. Von jedem Menschen sind 
nur zwei Punkte auf einer Karte zu bestimmten Zeitpunkten bekannt; sie werden 
jedoch auf der Karte durch eine gleichförmige Animation von Geburts- zu Ster- 
beort bewegt, so dass die Reise des Individuums sichtbar wird - natürlich eine 
Fiktion, da sie in Wahrheit kaum auf direktem Weg und zudem in einer ganz 
anderen Zeitspanne stattfand. Wenn im letztgenannten Zitat von Zuglinien und 
Autostraßen die Rede ist, scheinen diese in der Animation sichtbar zu werden, 
was aber eine durch die Macher des Videos intendierte Überinterpretation dar- 
stellt. Gleichwohl kann man argumentieren, dass dieses Mehr an Interpretation, 
obwohl streng genommen nicht erlaubt, gerade der Schlüssel für eine „große 
Antwort“ durch die Visualisierung ist. Der Visualisierung ist eine rhetorische 
Qualität oder ein pragmatischer Mehrwert eingeschrieben, die aus dem Dia- 
gramm mehr macht, als eine geschickte Visualisierung von Datensätzen. 

Wenn es nun aber darum geht, das Besondere der Visual Analytics zu charak- 
terisieren, kann die Antwort vor dem Hintergrund der diagrammatischen Überle- 
gungen nur eine graduelle sein: Die Visual Analytics produzieren keine qualitativ 
anderen Diagramme als alle anderen Paradigmen. Es ist höchstens so, dass sie die 
diagrammatischen Eigenschaften so weit wie möglich ausreizen. Dem Moment 
der Transformation in eine andere diagrammatische Grundfigur kommt eine ent- 
scheidende Bedeutung zu (bei Schich die Überführung der banalen Datensätze in 
einen animierten Graph), insbesondere aber dann dem Moment der Operationali- 
tät. Diagramme sind im Verständnis der Visual Analytics explorative Diagramme, 
die nicht in erster Linie der Ergebnispräsentation, sondern der Exploration der 
Daten dienen. In der Literatur zu Visual Analytics werden dann auch Präsenta- 
tions- und Explorationsgrafiken unterschieden: 


Presentation graphics are like proofs of mathematical theorems; they may give no hint as 
to how a result was reached, but they should offer convincing support for its conclusion. 
Exploratory graphics, on the other hand, are used for looking for results. Very many ofthem 
may be used, and they should be fast and informative rather than slow and precise. They 
are not intended for presentation, so that detailed legends and captions are unnecessary. 
One presentation graphic will be drawn for viewing by potentially thousands of readers 
while thousands of exploratory graphics may be drawn to support the data investigations of 
one analyst. (Chen et al. 2008, 5) 


Die Explorationsgrafiken sind also Arbeitswerkzeuge, für die anderen Qualitäts- 
kriterien gelten als für Präsentationsgrafiken. Das bedingt aber auch, dass explo- 
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rative Diagramme viel starker in alle anderen Schritte der Datenaufbereitung und 
Interpretation eingebettet sind und nicht einfach das Endergebnis dieser Schritte 
sind. Dies machen beispielsweise Keim et al. deutlich, die von einem Visual-Ana- 
lytics-Process sprechen (Keim et al. 2010, 10). Abbildung 6 zeigt deren Modell, das 
die enge Verzahnung der Komponenten Daten, Datenmodellierung, Visualisie- 
rung und Erkenntnis verdeutlicht. 
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Abb. 6: Der Visual Analytics-Process nach Keim et al. (2010: 10) 


Das Modell macht auch deutlich, dass ein zirkulärer Prozess angenommen wird, 
bei dem gewonnene Erkenntnisse immer wieder neu in die Datenaufbereitung 
und Modellierung einfließen und zu neuen Modellierungen führen. Wichtig 
ist aber auch, dass die Visualisierung nur ein Aspekt der Exploration ist, denn 
gleichgestellt sind Verfahren des Dataminings (statistische Analysen, statistische 
Modellierung etc.), die auch ohne Visualisierungen auskommen. 

Mit einem grundlegenderen diagrammatischen Begriff, wie ich ihn stark 
machen möchte, greift das Modell jedoch zu kurz, da entscheidende diagramma- 
tische Operationen bereits bei der Datenaufbereitung und Datentransformation 
und auch bei der statistischen Modellierung eine Rolle spielen. Dies werde ich in 
Kapitel 4 genauer diskutieren. 
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2.3.2 Visualisierungen zwischen Abbild und Konstruktion 


In den Naturwissenschaften und insbesondere in der Medizin sind neben Dia- 
grammen der bisher thematisierten Art insbesondere sogenannte bildgebende 
Verfahren weit verbreitet, etwa Röntgen- und Ultraschallaufnahmen oder die 
Magnetresonanztomographie. In der Linguistik und generell den Geisteswissen- 
schaften sind solche Visualisierungen seltener. Eine Ausnahme bildet hier aller- 
dings etwa die Phonetik, in der beispielsweise Sonogramme benutzt werden, um 
die Lautstruktur sichtbar zu machen. 

Entgegen der Bedeutung von „bildgebend“, die ein 1:1-Abbildungsverhältnis 
zwischen Gegenstand und bildlicher Darstellung suggeriert, handelt es sich bei 
solchen Verfahren dennoch vielmehr um ein „komplexes Zusammenspiel sozi- 
aler, technischer, mikropolitischer, kultureller und kognitiver Aktivitäten“, was 
Regula Burri als „doing images“ bezeichnet (Burri 2001, 277). Es sind zunächst 
komplexe technische Apparate notwendig, um diese Bilder generieren zu können. 
Zudem wird Personal benötigt, das diese Apparate bedienen kann. Eingebettet ist 
dies in eine medizinische Praxis, die von bestimmten Untersuchungsinteressen 
ausgeht, um überhaupt die richtigen bildgebenden Verfahren und die passende 
Parametrisierung derselben einsetzen und „sinnhafte Bilder“ erstellen zu können 
(Burri 2001, 281). Die Interpretation der entstandenen Bilder geschieht dann auf 
der Basis des Vorwissens — wie entscheidend dieses Vorwissen ist, machen Zitate 
von Fachpersonen in Regula Burris Studie deutlich: 


Erkannt und gesehen kann nur werden, was schon durch Vorwissen bekannt ist - what you 
get is what you see. Das Argument eines WYGIWYS - in Umkehrung des Topos WYSIWYG 
[What you see is what you get - der Leitspruch des digitalen Desktop Publishing, NB] - wird 
vom Radiologen Bruno Aeschlimann gar noch zugespitzt: „Man sieht eigentlich nur, was 
man kennt, und man sieht nur, was man sehen will.“ (Burri 2001, 288) 


Neben dem „doing images“ ist bei den bildgebenden Verfahren zudem bemer- 
kenswert, wie nahe wir uns dem dargestellten Gegenstand ‚fühlen‘ und wie 
‚real‘ bzw. ‚wirklich‘ er von uns empfunden wird. Das computertomographisch 
erstellte Schnittbild eines Schädels als dreidimensionale Visualisierung, durch 
die Schnitt für Schnitt gewandert werden kann, erscheint uns als plausibles 
Abbild des Kopfes, ist jedoch Ergebnis einer komplexen Verrechnung von physi- 
kalischen Messsignalen: „Faktisch [...] sind diese Bilder keine Abbilder, sondern 
visuell realisierte theoretische Modelle bzw. Datenverdichtungen“ (Heintz/Huber 
2001, 9). Trotz ihrer hochgradigen Konstruktivität wirken die Visualisierungen 
bildgebender Verfahren oft so selbstverständlich, dass sie nicht angezweifelt 
werden, sondern als „ganz normale Bilder“ gelesen werden: 
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Ganz „normale“ Bilder bedürfen keiner Begründung. Jeder sieht oder kennt sie — keiner 
regt sich auf oder wundert sich. Wenn alle meinen, das gleiche zu sehen und zu verstehen, 
dann ist dies die Wirklichkeit. Das Abgebildete ist glaubwürdig, seine Repräsentation ist 
vertrauenswürdig und gewinnt mitunter sogar Beweiskraft. Mag das, was die Bilder aus- 
sagen, noch so spektakulär erscheinen, ihre Aussagekraft oder Evidenz wird vom Inhalt 
nicht berührt. Denn ihre Selbstverständlichkeit gewinnen normale Bilder dadurch, dass sie 
in ihrer Form den Erwartungen ihrer Anwender entsprechen und im vorgegebenen Hand- 
lungskontext verfügbar gemacht werden können. (Gugerli/Orland 2002, 9) 


Die berechnete Abbildung erscheint uns als Abbild der Wirklichkeit, dessen 
Wahrheitsgehalt wir nicht hinterfragen, weil es kanonisiert ist und unseren 
Erwartungen entspricht. 

Das Ultraschallbild eines Kindes im Leib seiner Mutter (vgl. Abbildung 7) ist 
eine heute absolut vertraute Darstellungsart und man blickt sozusagen durch 
dessen Materialität und Medialität hindurch auf das Abgebildete und nur dieses, 
das abgebildete Kind, ist im Normalfall Gegenstand der Betrachtung. 


TOSHIBA 
MATERNITE ZUERICH 


Abb. 7: Ultraschallbild eines Kindes im Leib seiner Mutter 


Die nötigen Mechanismen zur Herstellung des Bildes sind bei Laien, aber wahr- 
scheinlich auch den Fachpersonen, kaum ständig präsent. Solche Ultraschallbil- 
der werden zudem ja meist als Live-Bilder während der Untersuchung von der 
werdenden Mutter als auch der behandelnden Ärztin und ggf. weiteren Anwe- 
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senden betrachtet, was die Wirkung, man würde mehr oder weniger direktin den 
Körper schauen, bestärkt. Die komplexen Umrechnungen von Ultraschallsigna- 
len und deren Modellierung zu einer Visualisierung, die den Anschein erweckt, 
eine Abbildung im Sinne einer fotografischen Darstellung der Organe des Körpers 
zu sein, sind bei der Betrachtung nicht präsent. 

Auch wenn solche Bilder für uns alltäglich geworden sind, so sind sie doch 
schwer zu deuten. Auf dem Ultraschallbild oben erkennt der Laie womöglich 
links den Kopf und daneben die Faust des Kindes, wenn die Angabe ,,Maternité 
Zürich“ aber nicht enthalten wäre, könnte eine vertrauenswürdige Fachperson 
einen Laien wohl auch glaubhaft davon überzeugen, dass dies eine Niere sei. Und 
um die für die Untersuchung relevanten medizinischen Erkenntnisse zu gewin- 
nen, ist eine fachliche Schulung notwendig, um das Bild deuten zu können. 

Die jeweiligen bildgebenden Verfahren waren keineswegs immer Teil des 
Fachkanons, sondern zu Beginn oft umstritten. Dies zeigt beispielsweise Schlich 
(1997) am Beispiel der Arbeiten von Robert Koch, welche dieser gegen Ende des 
19. Jahrhunderts in der Bakteriologie durchführte. Wesentlich für Kochs For- 
schungen waren seine bakteriologischen Visualisierungstechniken, um den 
Zusammenhang von Krankheiten und bestimmten Bakterien, deren Übertragung 
und Bekämpfung zu analysieren und dokumentieren. So formuliert Schlich: 


Charakteristisch und für die Zeit neu war dabei [bei den Kochschen Postulaten in der Bak- 
teriologie, NB], daß die als Äußerung eines mikroskopischen Lebewesens verstandenen 
Krankheitserscheinungen in einer bestimmten Weise mit der Visualisierung dieses Mikro- 
organismus verknüpft wurden. Koch legte größten Wert auf die bildliche Darstellung von 
Krankheitserregern. Dazu übernahm er nicht nur bereits vorhandene Visualisierungstech- 
niken und setzte sie auf die neue Art ein, er entwickelte auch neue Arten der Bildherstel- 
lung, z.B. zur Fotografie von Bakterien. (Schlich 1997, 166) 


Zu diesen Visualisierungstechniken gehörte die Erstellung eines Präparats auf 
einer Nährlösung und dessen Einfärbung, um Hintergrund und Bakterien unter 
dem Mikroskop sichtbar und abbildbar zu machen. Dafür griff er zunächst auf 
Zeichnungen zurück, später auf Fotografien, um ein Medium zu verwenden, bei 
dem der Glaube, dass es den Gegenstand unverfälscht darstellt, größer war. 

Um die Visualisierungen jedoch zu einem nützlichen Instrument der Identifi- 
kation von Bakterien und damit zu einem Indikator für Krankheiten zu machen, 
waren nicht nur die technischen Vorkehrungen nötig, sondern auch die Entwick- 
lung einer bildgeleiteten Lesekompetenz, einer „Kultur des mikroskopischen 
Sehens“. Koch musste, um Vertrauen in die Richtigkeit und Wirkmächtigkeit 
seiner Bilder zu schaffen und seine Kollegen von seinen Erkenntnissen zu über- 
zeugen, zunächst seine Experimente vor ihnen wiederholen und dazu die Bilder 
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erzeugen. Als sich das Vertrauen einstellte, reichten die Zeichnungen und Foto- 
grafien als Beweismittel aus: 


Auf diesen Bildern konnte der Leser das sehen, was Koch gesehen hatte, ohne seine Ver- 
fahrensschritte wiederholen zu müssen. Bei der Präsentation einer solchen wissenschaftli- 
chen Abbildung erscheint das dargestellte Objekt selbst völlig getrennt vom Darstellungs- 
vorgang: Die nun sichtbare Bakterie wird nicht als Produkt eines Herstellungsprozesses 
angesehen, sie hat, so wie man sie sieht, unabhängig von ihrer Darstellung schon immer 
existiert. (Schlich 1997, 171) 


Doch auch bei den Fotografien war eine „Kultur des fotografischen Sehens“ 
unabdingbar, da im Gegensatz zur Beobachtung der Präparate direkt unter dem 
Mikroskop die Probe nicht bewegt oder der Fokus des Mikroskops verändert 
werden konnte (Schlich 1997, 175). Nachdem sich aber diese Art der Visualisie- 
rung in der Bakteriologie etabliert hatte, konnten Streitfragen, etwa darüber, „ob 
bestimmte Bakterienarten Bewegungsapparate - so genannte Geißeln — besitzen 
oder nicht“, mit einem Schlag unter Rückgriff auf Bilder beantwortet werden — 
„und damit auch der Leser sich mit eigenen Augen überzeugen konnte, verwies er 
auf die beigegebenen Abbildungen“ (Schlich 1997, 178). 

Damit ist diese Visualisierungstechnik zu einem kanonisierten naturwis- 
senschaftlichen Bild geworden, mit dem die Erwartung verbunden ist, „dass 
die gezeigten Informationen für andere überprüfbar und wiederholbar sowie 
hinsichtlich ihres gestischen, apparativen und theoriegeleiteten Zustandekom- 
mens nachvollziehbar sind“ (Werner 2008, 31). Die Kanonisierung drückt sich 
dadurch aus, dass es „Normierungs- und Standardisierungsprozesse gibt, auf 
deren Grundlage die Aussagefähigkeit des Bildes beurteilbar wird. Wissen und 
Erkenntnis werden in einem Gewebe aus Sprechen, Bild und Text konstituiert 
und vermittelt (Werner 2008, 34). 


2.3.3 Visualisierungen und wissenschaftliche Praxis 


Mit den Prozessen der kulturellen Kanonisierung, die nötig ist, damit wissen- 
schaftliche Visualisierungen auch anerkannt, evident und als vertrauenswürdig 
eingestuft werden, wurde das Verhältnis von Visualisierungen und wissenschaft- 
licher Praxis bereits eingeführt. Es kann also die Annahme bestätigt werden, dass 
es in der Wissenschaft eine besondere Praxis des Umgangs mit Bildern gibt. Dabei 
ist dieses Verhältnis abhängig vom jeweiligen Fachdiskurs: Schlägt man ein lite- 
raturwissenschaftliches oder philosophisches Buch auf, findet man nicht selten 
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kaum oder nur wenig Abbildungen.’ Nimmt man dagegen ein Werk aus der Bio- 
logie, werden sich dort sehr viele Bilder finden. Diese Bilder unterscheiden sich 
aber von Bildern, die man beispielsweise in computerlinguistischen Texten findet. 

Man könnte nun - einer lapidaren, ersten Überlegung folgend — den Stand- 
punkt vertreten, dass sich bestimmte Gegenstände eben dazu eignen, bebildert 
zu werden, andere hingegen nicht. Diese Behauptung ist bei anwendungsbezo- 
gener Betrachtung schnell nicht mehr haltbar, betrachtet man etwa die äußerst 
erfolgreiche „RSA Animate Series“ von Andrew Park, der mit sogenannten 
„Whiteboard Animations“ die Vorträge von Intellektuellen visualisiert (Halliday 
2011), z.B. einen Vortrag von Slavoj Zizek (vgl. Abbildung 8). 
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Abb. 8: Screenshot eines RSA Animate-Films von Andrew Park, veröffentlicht 2010, zu einem 
Vortrag des Philosophen Slavoj Žižek über sein Buch „First As Tragedy, Then As Farce“ (vgl. 
https: //www.youtube.com/watch?v=hpAMbpQ8)7g, letzter Zugriff: 22. 9. 2020) 


Selbstverständlich handelt es sich bei den Whiteboard Animations um eine 
ganz spezifische Form der Visualisierung, deren Diagramm-Charakter diskutiert 


5 Vgl. als Gegenbeispiel in der Philosophie die Diskussion um den dtv-Atlas Philosophie von 
1991, der mit Bebilderungen arbeitet - dazu: Pörksen (1997, 226). 

6 Die ,,Royal Society for the Encouragement of Arts, Manufactures & Commerce“ (RSA) ist eine 
britische Wohltätigkeitsorganisation, die sich der Aufklärung im 21. Jahrhundert verschrieben 
hat. 
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werden kann. Es soll auch nicht angezweifelt werden, dass bestimmte Diszipli- 
nen bestimmte Visualisierungsformen präferieren. 

Aber es sind nicht primär praktische, inhaltlich bedingte Erwägungen, die 
dazu führen, dass in einer Disziplin Visualisierungen verwendet werden oder 
nicht und welcher Gestalt diese sind. 

Stattdessen handelt es sich um Aspekte wissenschaftlicher Diskurse und die 
Foucault’sche Diskursanalyse scheint zunächst ein geeigneter Rahmen, um diese 
zu untersuchen. Foucault selbst ignoriert jedoch die Rolle der Bilder in Diskursen 
komplett, wie Claus Zittel (2014) feststellt: 


Es scheint, dass Foucault wissenschaftliche Bilder im Unterschied zu Kunstbildern als für 
die Diskursanalyse unproblematisch ansieht, unterstellend, dass solche Bilder eindeutig 
seien, zweckbestimmt, ersetzbar — Bilder zum Verbrauch, Bilder also von einem diskursana- 
logen Seinstyp, mit klaren Ordnungen, Tabellen und Diagrammen etwa, deren Gehalt sich 
in Sprache einholen lasse oder in ihr strukturelle Entsprechungen finde. (Zittel 2014, 87) 


Auch die Historiographie der Philosophie ist nach Zittel blind gegenüber der 
Rolle der Bilder: 


Für die Geschichtsschreibung der Philosophie ist daher die Frage nach der historiographi- 
schen und systematischen Bedeutung von Bildern schnell beantwortet: Wenn nicht von 
Metaphern, sondern von materialen Bildern die Rede ist, so spielen sie keine Rolle. (Zittel 
2014, 86) 


Diese Rolle von Bildern in Diskursen müsste aber genauer untersucht werden, 
denn bei einem ersten fokussierten Blick auf Diskurse wird klar, dass Bilder nicht 
nur eine Repräsentationsfunktion wahrnehmen, sondern durch verschiedene 
Diskurse zirkulieren und dort unterschiedliche Funktionen und Bedeutungen 
einnehmen: „Ein und dasselbe Bild kann folglich auf konträre Diskurse referie- 
ren, die wiederum mit ihm Evidenz für die jeweilige Theorie reklamieren“ (Zittel 
2014, 98). Zittel arbeitet daher ein bildaffines Diskurskonzept aus, das auf Ludwik 
Flecks „Denkstile“ zurückgreift und unter der Perspektive der „Zirkulation und 
Promiskuität von Bildern“ ihre Funktions- und Wirkungsvielfalt in den Blick 
nimmt: 


Was lässt sich aus diesen Bild-Zirkulationen folgern? Ein Bild trittin verschiedene Text-Bild- 
Konstellationen ein, mit jeweils anderem theoretischen Rahmen, der jedoch nicht bereits 
fertig vorliegt, sondern in Interaktionen vom Bild zum Beispiel über die von ihm provozier- 
ten Metaphoriken in der Beschreibungssprache mitkonstituiert wird. Das Bild zirkuliert, 
wie auch die Beobachtungsberichte, somit haben wir es hier nicht mit stabilen Konstellati- 
onen zu tun, sondern es bilden sich durch die Zirkulation nach und nach unterschiedliche 
transitorische Denkstile aus, die in popularisierenden Darstellungen arretiert werden, und 
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in Gestalt von Leitbildern wieder auf die Forscherkollektive zurückwirken und dort Seh- 
und Denkzwänge erzeugen. (Zittel 2014, 103) 


Die Bilder gehen also „ohne ihren Begleittext auf Wanderschaft“ (Zittel 2014, 
96) und verändern je nach Kontext ihre Bedeutung und Wirkung und führen zu 
unterschiedlichen kulturellen Normierungen ihrer Deutung. 

In der Linguistik stellt die Darstellung von Sprachfamilien als Stammbaum 
ein eindrückliches Beispiel für eine solche Wanderschaft dar, wie Uwe Pörksen 
(1997, 112) zeigte (vgl. dazu grundsätzlich auch Lüthy/Smets 2009): Charles 
Darwin publizierte 1859 eine Skizze eines Stammbaums, um die Ideen seiner 
Evolutionstheorie zu verdeutlichen. Parallel, evtl. auch davon inspiriert, findet 
fast zeitgleich diese grafische Form des Stammbaums bei August Schleicher 
und Ernst Haeckel Eingang zur Visualisierung von Sprachfamilien.” Darwins 
„Stammbaum“-Skizze war eine vorsichtige, grafisch umgesetzte Denkfigur für ein 
hypothetisches Schema der Evolution mit offenem Anfang, also ohne sichtbaren 
Wurzelknoten. Die Stammbaumtheorie von Darwin fasst dann aber Fuß in der 
Sprachwissenschaft (wobei es ins 17. Jahrhundert zurückgehende Vorläufer gab, 
vgl. dazu Sutrop 2012, 315) und 


Haeckel veröffentlichte in seiner Anthropogenie [...] zwei Stammbäume, einen der ‚Säu- 
gethiere‘ und einen der ‚indogermanischen Sprachen‘, in nahezu klappsymmetrischer 
Gestalt [...]. Das ist keine ‚reine Denklinie‘ mehr, keine Hypothese, sondern eine sichere 
Sache, ein graphisches Bild der Abstammung. Der Stammbaum wird zur in die Fläche 
geklappten Realität. Der Strich ist fest, die Figur übersichtlich geometrisch, es ist ein gesi- 
cherter Stammbaum, der in ein Lehrbuch oder Handbuch passen könnte; er geht aber ein 
Stück über diesen Rahmen hinaus. Die stilisierte Symmetrie der beiden Stammbäume ist 
Behauptung. (Pörksen 1997, 115) 


Einerseits verwandelt sich die Zeichnung des Stammbaums bei Darwin mit den 
„zarten theoretischen Zweiglein“ zu einem Baumstamm, in „eine Wirklichkeit 
von solider Wucht, die Theorie der Abstammung steht buchstäblich als Winterei- 
che“ (Pörksen 1997, 117). Andererseits ist diese Form aber auch in der Sprachwis- 
senschaft prägend und führt dann in Konsequenz dazu, dass Schleicher aus dem 
Baum liest: 


In der gegenwärtigen Lebensperiode der Menschheit sind vor allem die Sprachen indo- 
germanischen Stammes die Sieger im Kampf ums Dasein; sie sind in fortwährender Aus- 
breitung begriffen und haben bereits zahlreichen anderen Sprachen den Boden entzogen. 
(Schleicher 1873; zit. nach Pörksen 1997, 120) 


7 Es ist nicht eindeutig bewiesen, ob Schleicher Darwins Zeichnung kannte; vgl. dazu Sutrop 
(2012) und Harleman Stewart (1976, 9). 
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In diesem Beispiel macht sicht eine Bildidee selbständig, gerade wohl auch 
deshalb so erfolgreich, weil die Grundfigur des hierarchischen Graphen, auch 
als Darstellungsform des Familienstammbaums, eine lange Geschichte auf- 
weist (Kruja et al. 2002; Lima 2014). Die Baumfigur wird dann auch in popu- 
lärwissenschaftlichen Kontexten gern aufgenommen, um Sprachfamilien oder 
Sprachentwicklungen zu visualisieren. Die Vergleichende Sprachwissenschaft 
arbeitet heute jedoch nicht mehr mit solchen Stammbaum-, sondern eher mit 
Netzdarstellungen (Sutrop 2012, 320). Abbildung 9 (Rohrdantz et al. 2012) zeigt 
den „World’s Language Explorer“, ein Beispiel für eine Visualisierung der Ähn- 
lichkeit von Sprachen aufgrund einer statistischen Auswertung von bestimmten 
Eigenschaften. Die Visualisierung ist für Laien nicht so intuitiv zu verstehen und 
nachvollziehbar wie die Stammbaumdarstellung, folgt sie doch einem grundsätz- 
lich anderen Konzept von Sprachgeschichte, das nicht deterministisch und teleo- 
logisch ausgerichtet ist. 
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Abb. 9: Darstellung der Ahnlichkeit von Sprachen (datenbasiert) im World’s Language Explorer 
(Rohrdantz et al. 2012) 


Wie in diesem Abschnitt eingangs ausgefiihrt, nehmen Bilder je nach Kontext 
unterschiedliche Bedeutungen an, so dass im Anschluss an Hartmut Stöckl 
analog zu Wortern auch bei Bildern von differenzierten Gebrauchsbedeutungen 
ausgegangen werden kann: 
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Ein konkretes Bild zu gebrauchen bedeutet, es zeichenhaft in einer sozialen wie kommuni- 
kativen Handlung einzusetzen. Dies impliziert die ebenfalls in Analogie zum Funktionieren 
von Sprache entwickelte Vorstellung von piktorialen Sprechakten [...]. In diesem Sinne und 
in Anlehnung an das Wittgenstein’sche Diktum von den Sprachspielen (auch Zeichenspie- 
len) kann man davon sprechen, dass sich die Bedeutung eines Bildes nur im Gebrauch 
zeigt. (Stöckl 2004, 54) 


Das skizzenhaft dargestellte Beispiel der Stammbäume mag bereits zeigen, wie 
aufschlussreich eine diskursanalytische Sicht auf die Rolle von Visualisierun- 
gen ist. Wie ich auch weiter unten (vgl. Abschnitt 3.2) vorschlagen möchte, bietet 
Ludwik Flecks Theorie der Denkstile hier einen geeigneten theoretischen Rahmen, 
um die Rolle von Visualisierungen in Diskursen zu untersuchen, konkret um der 
1) „Vielgestaltigkeit, Ungleichzeitigkeit, Wirkmacht und den Mehrfachcodie- 
rungen von Bildern in Philosophie und Wissenschaftsgeschichte“ Rechnung zu 
tragen, 2) „ die Dissemination und eigene Wirkungsgeschichte von epistemischen 
Bildern [zu] verfolgen und deren Verhältnis zum diskursiven Wissen [zu] taxie- 
ren“ und 3) „die Veränderungen, den Bilderfluss, die interpikturalen Relationen 
sowie deren Wechselwirkungen mit Theorien, Beobachtungen und Instrumenten 
in unterschiedlichen lokalen settings und im historischen Wandel zu beschrei- 
ben“ (Zittel 2014, 104). 

Dies ist ein Forschungsprogramm, das ich mit der vorliegenden Studie selbst 
eingeschränkt für die Linguistik keinesfalls leisten kann. Aber es sind Aspekte, 
die die folgenden Überlegungen immer wieder leiten werden. 

Mit dem Konzept der „Viskurse“ legt Karin Knorr Cetina (2001) einige Arbei- 
ten zur Visualisierungspraxis in naturwissenschaftlichen Disziplinen vor und 
verfolgt damit deutlich diskursanalytische Interessen. So untersuchte sie bei- 
spielsweise die wissenschaftliche Kommunikation in der Hochenergiephysik 
(HEP) am CERN in Genf (Knorr Cetina 2001). In diesem Kontext arbeiten zahl- 
reiche Wissenschaftlerinnen und Wissenschaftler rund um den Globus. Diese 
komplexe Kollaboration erfordert ausführliche Kommunikation und Knorr Cetina 
fokussiert in der erwähnten Studie den Diskurs mittels visueller Darstellungen, 
den „Viskurs“, den Knorr Cetina wie folgt definiert: 


Nicht nur Diskurs koordiniert diese Experimente [in der HEP, NB], sondern auch die visuelle 
Darstellung, der „Viskurs“. Damit ist zunächst einmal einfach Präsentation visueller Mate- 
rialien statt Gesprächen gemeint. Die dominante Form kollektiver Kommunikation in HEP- 
Experimenten ist der „Statusreport“, der die Mehrzahl der Präsentationen bei Teilnehmer- 
treffen ausmacht. Dieser gibt eine Zusammenfassung dessen, was „in der Zwischenzeit“, 
seit dem letzten Report, in einem Bereich passiert ist - eine Zusammenfassung der Interak- 
tion mit technischen Objekten -, er gibt sie aber nicht in erster Linie verbal, sondern durch 
graphische Darstellungen auf Folien. [...] Zweitens weist der Begriff „Viskurs“ aber auch auf 
die lateralen Bezugnahmen und Verknüpfungen der Darstellungen hin [...]. Drittens entfal- 
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ten Viskurse technische Objekte und haben eine interne Beziehung zu wissenschaftlicher 
Forschung. Wo es Viskurs gibt, wird Diskurs schnell als „bloßes Reden“ abgetan, der keine 
experimentellen Ergebnisse „zeigt“ und keinen Nachweis für die Durchführung bestimm- 
ter Arbeiten erbringt. Nur Abbildungen haben, wie wir wissen, rhetorische Beweiskraft — 
dadurch, daß es sich um „Inskriptionen“ (von Maschinen aus der „Natur“ produzierte 
Signale) handelt und nicht um bloße Deskription [...]. „Ich will die Folien sehen“, heißt es, 
und „sie haben ja keine Plots“, das heißt, sie haben die Arbeit nicht gemacht. (Knorr Cetina 
2001, 306-307) 


Bei dem Beispiel der HEP-Experimente ist die Bedeutung der Bilder augenfällig 
und schlägt sich auch auf die Präsentations- und Publikationsformen nieder. So 
bestünden Vorträge dort auch „praktisch nur aus der Projektion von Folien, auf 
denen sich auch spärlicher Zwischentext oder einleitende Bemerkungen hand- 
schriftlich eingetragen finden“ (Knorr Cetina 2001, 307). In Abschnitt 2.4 unten 
werde ich im Kontrast dazu auf die Situation in der Linguistik eingehen. 


2.3.4 Wissenschaftliche Visualisierungen als Popularisierungen 


Ultraschallbilder habe ich bereits als hochkomplexe Visualisierungstechnologie 
beschrieben, deren Ergebnis, das Bild, jedoch auch jedem Laien schnell zugäng- 
lich (wenn auch nicht unbedingt korrekt deutbar) ist. Hinzu kommt aber bei 
solchen Visualisierungen eine weitere spezifische Bedeutung, wie Marita Sturken 
und Lisa Cartwright formulieren: 


However, less than a decade into the sonogram’s use in obstetrics, studies began to show 
that pregnancy outcomes were only minimally affected by the technique—in other words, 
it was not a crucial diagnostic procedure to monitor the normal pregnancy through these 
images. Why, then, was this imaging technique so popular among obstetricians [...]? [...] 
One answer is that the fetal sonogram serves a purpose beyond medicine; in other words, it 
is not simply a scientific image but a cultural image. (Sturken/Cartwright 2009, 292) 


Wie niitzlich die Ultraschalluntersuchung in der Schwangerschaft ist, soll hier 
nicht diskutiert werden. Sturken und Cartwright verweisen aber auf den bereits 
oben mehrfach angesprochenen Aspekt der kulturellen Bedeutung von Visuali- 
sierungen und zeigen, wie etwa die Ultraschallbilder des Fötus im nichtmedizi- 
nischen Kontext die Bedeutung ändern. Sie werden zu einem „social document 
[that] helps to award to the fetus the status of personhood (and a place in family 
and community) more typically attributed to the infant after birth“ (Sturken/ 
Cartwright 2009, 294). Deshalb werden die Ultraschallbilder von den Eltern ins 
Babyalbum geklebt oder herumgezeigt, exakt so, als ob es sich um eine erste 
fotografische Darstellung des Babys handeln würde. Als anschauliches Beispiel 
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zeigen Sturken und Cartwright eine Autowerbung, bei der ein riesiges Ultra- 

schallbildes eines Fötus unterschrieben ist mit „is something inside telling you to 

buy a volvo“, kombiniert mit der Abbildung des Autos. Das Ultraschallbild wird 
ikonisch als „Familie“ gelesen und eine Parallelführung zwischen intrauteraler 

Sicherheit und Sicherheit im Auto (Sturken/Cartwright 2009, 293) suggeriert. 

Die Verwendung wissenschaftlicher Visualisierungen im nichtfachlichen 
Kontext bedarf deshalb einer besonderen Betrachtung, da die damit möglichen 
Rekontextualisierungen noch stärker variieren können als innerhalb des Faches. 
Uwe Pörksen hat mit dem Konzept der „Visiotype“ einen mit vielen Beispielen 
illustrierten Vorschlag gemacht, was mit wissenschaftlichen Visualisierungen 
auf dem Weg von der fachinternen zur populären Verwendung passiert (Pörksen 
1997). Er beruft sich dabei auf Ludwik Flecks Idee der Denkkollektive und insbe- 
sondere deren Gliederung in esoterische und exoterische Kreise und darauf auf- 
bauend in Zeitschrift-, Handbuchwissenschaft und populäre Wissenschaft (Fleck 
1980, 146). Pörksen sieht auf dem Gebiet der Visualisierung ebenso eine Reihe 
von Stufen, mit denen ein Visiotyp entsteht (Pörksen 1997, 133): 

— Zunächst fungieren Visualisierungen in Form von hypothetischen Skizzen 
als eine Art Denkkrücke für den/die Autor/in — etwa wie die oben erwähnten 
Skizzen von Darwin zu seiner Evolutionslehre. 

- Daraus kann ein hypothetisches Schema als Vorschlag für die Kolleg/innen 
werden. 

— Wenn sich dieses Schema etabliert, wird es zu einer Lehrbuchzeichnung für 
die Überlieferung und Absicherung des Wissens in der Gemeinde und im 
Lehrgebäude. 

- Wenn die Visualisierung in die nichtfachliche Öffentlichkeit gelangt, verän- 
dert sich deren Inhalt vollständig und passt sich der Bildsemantik der Öffent- 
lichkeit an. 

- Schließlich kann ein Visiotyp daraus entstehen, der zur allgemeinen Norm 
wird. 


Pörksen sieht in solchen Visiotypen Elemente, die Diskurse strukturieren: „Die 
Visiotype, von denen wir sprechen, sind nicht zuletzt Ausdruck und Prägestock 
einer Öffentlichkeit“ (Pörksen 1997, 105). Die DNA-Doppelhelix ist für Pörksen ein 
Beispiel für eine aus dem wissenschaftlichen Kontext entrissene globale Visio- 
type, die in der Öffentlichkeit ein Eigenleben entwickelt und durch diese Rekon- 
textualisierung neu semantisiert wird. Während das Konzept der Doppelhelix in 
den 1950er-Jahren in der Wissenschaft als hypothetisches Schema angesehen 
wurde, entwickelte sich die Darstellung in der Öffentlichkeit als farbige, doppelt 
gebänderte Wendeltreppe zum Symbol für die angeblich entschlüsselte „Spirale 
des Lebens“ (Pörksen 1997, 126). 
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Doch auch „Formen der Darstellung“, beispielsweise „Zahlenbilder“ als „Typus 
standardisierter Veranschaulichung“, die „zur allgemeinen sozialen Norm 
geworden“ (Pörksen 1997, 186) seien, zählt Pörksen zu Visiotypen. Er bewertet 
nicht nur die journalistische (und damit nicht-wissenschaftliche) Verwendung 
solcher Zahlenbilder negativ, auch die Durchdringung der Wissenschaft und ins- 
besondere der Geisteswissenschaften mit diesem Visiotyp sieht Pörksen kritisch. 
Interessant sind Pörksens Beobachtungen dazu, wie weitreichend Visiotype 
gesellschaftliche Diskurse prägen, oft weitgehend losgelöst von der ursprüng- 
lichen Bedeutung der Darstellungen in der Wissenschaft. Beispiele für solche 
„Bilder von globaler Wirkung“ wären nach Pörksen die „exponentielle Kurve“ 
in Anwendungen wie der „Aidskurve“ oder „Bevölkerungskurve“, oder aber die 
„Datenautobahn“ (Pörksen 1997, 199), wobei letztere auch deutlich macht, dass 
Pörksen auch mit abstrakten Konzepten arbeitet: Die Datenautobahn wäre eine 
in der Öffentlichkeit verwendete Metapher, die durch die Dominanz der „Zahlen- 
bilder“ in den Wissenschaften hervorgebracht worden ist. 

Pörksen kritisiert in seinem Buch also nicht nur Visiotype, die sich in der 
Öffentlichkeit verfestigen und die aber nicht angemessen reflektiert werden, 
sondern auch solche, die die Wissenschaften selbst prägen. Ein aktuelleres Bei- 
spiel für solche Prozesse aus dem Bereich der Sprache mag die „Tagcloud“ sein. 
Tagclouds, Wortwolken oder Schlagwortwolken wurden ursprünglich auf Web- 
2.0-Plattformen und Blogs verwendet, um Schlagworte anzuzeigen und gleichzei- 
tig darüber navigieren zu lassen (Feinberg 2010, 37). Die typografische Idee, iso- 
lierte Wörter auf einer Fläche anzuordnen und die Schriftgröße zu semantisieren, 
war damals natürlich nicht gänzlich neu. So wird diese Darstellungsart beispiels- 
weise bei Landkarten eingesetzt, auf denen die Größe der Beschriftung der Orte 
sich nach deren Bedeutung (Größe) oder administrativer Funktion richtet. Ein 
weiterer Vorläufer der Darstellung wird in den Wikipedia-Artikeln zu „tag cloud“ 
bzw. „Schlagwortwolke“ mit dem Umschlagbild des Buches „Tausend Plateaus: 
Kapitalismus und Schizophrenie“ von Gilles Deleuze und Félix Guattari (1993) 
genannt, auf dem eine Wortwolke zu sehen ist. 

Auch wenn unklar bleibt, wer die erste Idee zu dieser Art bildlicher Darstel- 
lung hatte - die Wortwolke hat einen Siegeszug durch Wissenschaft und Öffent- 
lichkeit erlebt, der auch durch Plug-ins und Online-Generatoren wie „Wordle“ 
(Feinberg 2010), sowie Bibliotheken für Programmiersprachen wie R, befeuert 
worden ist. Ein Generator wie „Wordle“ erlaubt dabei die Eingabe eines ganzen 
Textes, bei dem ‚Stoppwörter‘® entfernt und die Wortfrequenzen berechnet 


8 Unter Stoppwörtern werden normalerweise häufige Funktionswörter verstanden, die aus 
nicht-linguistischer Perspektive als eher bedeutungsarm eingeschätzt werden. 
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werden, um danach ein mit verschiedenen Parametern beeinflussbares Bild 
generieren zu können. Abbildung 10 zeigt ein Beispiel für eine solche Wortwolke. 
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Abb. 10: Eine mit dem Webdienst „wortwolken.com“ erstellte Wortwolke des ersten Kapitels 
dieses Buches (Vorversion) 
Der Programmierer von „Wordle“ schreibt über sein Programm: 


If you consider Wordle strictly as an information visualization tool, certain aspects of its 
design could be criticized for their potential to mislead or distract its users. (Feinberg 2010, 54) 


Wordle was not designed for visualization experts, text analysis experts, or even experienced 
computer users. I tried to make Wordle as appliance-like as possible. (Feinberg 2010, 57) 
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Die angestrebte Nutzergruppe waren also Laien und Feinberg selbst macht die 
Schwächen der Darstellung seiner Anwendung deutlich (Feinberg 2010, 54-58): 
Weder Position noch Farbe der Wörter sind semantisiert und die Größe der darge- 
stellten Wörter gibt nur einen schlechten Eindruck von der Frequenz, da norma- 
lerweise die Höhe der sogenannten „Bounding Box“, also der das Wort umgeben- 
den (unsichtbaren) Box, damit korreliert, nicht aber die Breite. So werden längere 
Wörter automatisch als prominenter wahrgenommen, auch wenn sie gleich hoch 
sind wie kürzere. 

Der Visualisierungstyp findet jedoch trotzdem Eingang in den wissenschaftli- 
chen Visualisierungskanon, auch ich selbst verwendete Wortwolken in verschie- 
denen Publikationen (vgl. Abbildung 11). Allerdings geschieht dies durchaus mit 
zweifelhaften Nutzen, denn eine nach Signifikanz geordnete Liste, ggf. mit grafi- 
schem Indikator für die Signifikanz (oder Frequenz, falls damit gearbeitet wird), 
wäre wohl übersichtlicher gewesen. 
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Abb. 11: Wortwolke aus Bubenhofer/Scharloth (2011, 249); sie zeigt fiir die Zeit von 1960 bis 
1979 typische Lexeme in einem Korpus alpinistischer Texte im Vergleich zu früheren Texten — 
erstellt mit der Software „Wordle“ (Feinberg 2010) 
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Der Mehrwert der Wortwolke liegt dann aber eher in der Ästhetik - auch der 
Wordle-Erfinder nennt den Aspekt des ,Gefallens‘ als Zweck seiner Anwendung: 
„Since Wordle [...] was meant to be pleasing, I had to give some thought to the 
expressive qualities of fonts and color palettes“ (Feinberg 2010, 41). So werden 
Wortwolken nicht nur in (sprach-)wissenschaftlichen Kontexten und auch 
nicht nur in digitalen Medien verwendet, sondern auch als dekoratives visuel- 
les Element in allen möglichen Situationen. Stellvertretend für solche Verwen- 
dungen sei ein beliebiges Beispiel herausgegriffen: Wortwolken als sogenannte 
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„Wandtatoos“ (vgl. Abbildung 12). Von der ursprünglichen Idee der Tagclouds 
überlebte hier nur die grafische Anordnung von Schlüsselbegriffen; sie sind 
aber weder klickbares Navigationselement noch datenbasiert erhoben, sondern 
nehmen bloß eine grafische Figur auf und passen sie an Dekorationszwecke an. 
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Abb. 12: Website lifestyle-decor.de mit einem Angebot an „Wandtatoos“ in Form von 
Wortwolken 


Wenn man Pörksen folgt und in Visiotypen Prägestöcke der Öffentlichkeit sieht, 
müsste untersucht werden, inwiefern die Idee der Kondensierung von Text auf 
Schlagwörter und deren grafische Anordnung auf der Fläche als Repräsentation 
dieser Texte übertragen wird auf sozial geprägte Lebenswelten. Die Wortwolke 
denotiert Wohnräume, wobei deren Semantik über die Schlagworte ausgedrückt 
(und geprägt) wird. 

Der Fall der Wortwolken zeigt die mitunter verschlungenen Wege zwischen 
Experten- und Laiendiskursen von Diagrammen: Von der Anwendung als grafi- 
sche Repräsentation von Schlagwörtern im Web 2.0 zu einem diagrammatischen 
Mittel in der (Sprach-)Wissenschaft — changierend zwischen wissenschaftlicher 
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Visualisierung und Dekoration - hin zu einer dekorativ eingesetzten Repräsenta- 
tion sozial konventionalisierter Lebensräume. Denn das tun ja die oben erwähn- 
ten „Wandtattoos“: Sie semantisieren Lebensräume, allerdings nicht individu- 
ell, sondern nach Maßgabe gesellschaftlicher Konventionen und Vorstellungen 
darüber, was man in Schlafzimmern, Küchen und Bädern tut, und repräsentieren 
dies. 


2.4 Diagramme in der Sprachwissenschaft am Beispiel der 
‚Reihe Germanistische Linguistik‘ 


Auf der Suche nach Diagrammen mag ein Blick in linguistische Publikationen 
zunächst enttäuschend sein: Im Durchschnitt sind in solchen Publikationen 
nämlich nur wenig Diagramme vorhanden. Kein Vergleich mit beispielsweise 
Publikationen in den Naturwissenschaften, wo neben Diagrammen im engeren 
Sinn oft auch Ergebnisse mittels bildgebender Verfahren spektakulär in Szene 
gesetzt werden (vgl. Abschnitt 2.3.3). 

Ann Harleman Stewarts „Graphic Representation of Models in Linguistic 
Theory“ (1976) ist meines Wissens der jüngste Versuch, in der Linguistik gängige 
Diagramme - allerdings mit der im Titel genannten Einschränkung auf Modell- 
repräsentationen - zu diskutieren und klassifizieren. Sie nennt darin Baumdia- 
gramme, Matrizen und Boxdiagramme (vgl. dazu Kapitel 5). 

Im vorliegenden Abschnitt werde ich eine kurze Bestandesaufnahme der 
diagrammatischen Praxis in der Linguistik machen, insbesondere anhand einer 
systematischen Auswertung aller Diagramme in der bekannten Buchreihe „Reihe 
Germanistische Linguistik“ (RGL) von 1975 bis 2016. Ein Blick in wichtige linguis- 
tische Grundlagenwerke wird diese Bestandesaufnahme ergänzen. 


2.4.1 Fragestellung und Konzeption 


Ziel der Analyse ist es, einen systematischen Überblick über die diagrammati- 

sche Praxis in der (germanistischen) Linguistik zu erhalten - mit vertretbarem 

Aufwand. Der Überblick soll Auskunft darüber geben, wie über alle Teildiszipli- 

nen der Linguistik hinweg Diagramme verwendet werden. Insbesondere: 

- Welche Diagrammtypen werden verwendet? 

- Was repräsentieren die Diagramme? 

- Wie verändert sich die Verwendung über den untersuchten Zeitraum von 
1975 bis 2016? 
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— Daneben wurden weitere Aspekte erhoben wie etwa: Art des Verweises auf 
das Diagramm, Legende, zitiertes Diagramm oder Original. Diese Aspekte 
wurden jedoch nicht für den ganzen Datensatz erhoben. 


Als Untersuchungsobjekt wurde die bis heute bei De Gruyter (zuvor bei Niemeyer) 
erscheinende „Reihe Germanistische Linguistik“ (RGL) ausgewählt, die seit 1975 
existiert und den Vorteil hat, dass sie (nach eigenem Bekunden) thematisch 
breit und offen gegenüber Forschungsperspektiven und Methodologien ist. Es 
erscheinen sowohl Monographien (bis 2016: 240 Bände) als auch Sammelbände 
(60 Bände) sowie auch vereinzelt Wörterbücher (3 Bände).? Die Reihe wurde und 
wird von etablierten Linguistinnen und Linguisten herausgegeben und durch 
einen wissenschaftlichen Beirat begleitet. Alle Beiträge werden dabei einem 
Begutachtungsverfahren unterzogen. 

Dank des Erscheinungszeitraums seit 1975 und der Kontinuität der Form (bis 
heute in Buchform von ähnlichem Umfang und ähnlichem Layout) eignet sich 
besonders diese Reihe sehr gut, um den Wandel der diagrammatischen Praxis zu 
untersuchen. 

Es wurden insgesamt 18 Diagrammtypen oder Diagrammaspekte angenom- 
men und damit vier Grundtypen unterschieden: Tabellen, Graph- und graphähn- 
liche Diagramme, Achsendiagramme und eine Mischgruppe. Tabelle 1 zeigt die 
verwendete Klassifizierung der Diagramme. Wichtig zum besseren Verständnis 
der Analyseergebnisse ist der Hinweis, dass bei der Klassifikation Mehrfachklas- 
sifikationen möglich waren, da ein Diagramm beispielsweise als Flussdiagramm 
Pfeile und mathematisch formelhafte Ausdrücke gleichzeitig verwendet. 

Eine weitere wichtige Unterscheidung ist jene des Referenten des Diagramms: 
Ein Diagramm kann: 

- Daten wiedergeben (z. B. Gesprächstranskript, KWiC/Konkordanz) 

- Daten in aggregierter Form wiedergeben (z.B. Summen, Mittelwerte etc.) 

- ein Modell repräsentieren (z.B. ein Zeichenmodell) 

- ein Modell anwenden (z.B. das Stellungsfeldermodell oder ein Syntaxbaum 
auf einen Satz) 


Diese Klassifikation bildet den Hintergrund fiir die Auswahl der Diagramme. Am 
gesamten Prozess der Erhebung waren drei Personen involviert: A (ich selbst), 
B (Irene Ma), C (Maria Silveira) - alles linguistisch ausgebildete Personen.’° 
Zunächst wurde die Klassifikation mit Hilfe von C einem Pretest unterzogen und 


9 Vgl. https://www.degruyter.com/view/serial/36314 (22.9. 2020). 
10 Hiermit geht ein großer Dank an Irene Ma und Maria Silveira für ihre Hilfe. 


Tab. 1: Klassifikation der Diagramme 


Diagrammgruppe 


Typen/Aspekte 
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Bemerkungen/Erklärung 


Tabellen Zahlentabellen und Grafisch umgesetzte Tabelle oder auch tabellen- 
andere Tabellen artig gesetzter Text. Zahlentabellen enthalten 
zu großen Teilen Zahlenwerte; andere sind 
textgliedernde Tabellen. 
Achsendia- Balken-, Kreis-, Diese Diagramme nutzen ein Koordinaten- 
gramme Linien-, Punktdia- system zur Orientierung (x-, y-, z-Achsen oder 


gramme, Karten 


Winkelachsen bei Kreisdiagrammen). 


Graphen und 
graphartige 


Baumgraph, Netz- 
graph, Flussdiagramm, 


Als Graph oder graphartig gelten Diagramme, 
die nach dem Prinzip von Knoten und Verbin- 


Diagramme Dreieckdiagramm, dungen dazwischen (Kanten) aufgebaut sind. 
andere 
Weitere Transkripte/Dialogdar- | Gruppe von Diagrammen, die alle in einer Form 


stellungen/Textbelege 


Text als Daten darstellen aber keine KWiCs sind. 


Keyword in Context 
(KWiC, Konkordanzen) 


Klassische Konkordanzdarstellung v.a. in der 
Korpuslinguistik 


mathematisch Formel- 
haftes 


Diagramme, Formeln, die mathematisch/logisch 
aufgebaut sind oder zumindest formelhaft sind 
(Beispiel formale Semantik) 


Pfeile Im Diagramm (egal welchen Typs) werden Pfeile 
verwendet. 
Sonderformen Nicht mit den bestehenden Klassen fassbares 


Diagramm. 


geringfügig angepasst. Zudem wurde eine Anleitung erstellt, um die spätere Klas- 

sifikation zu ermöglichen. 
Es wurden zwei Samples aus den Bänden 1 (1975) bis 307 (2016) gezogen; das 

Verfahren war wie folgt: 

- Sample 1: Die Bände 1 (1975) bis 190 (1998) wurden von A manuell durchge- 
blättert und es wurden alle Diagramme, die in eine der Klassen fallen, foto- 
grafiert. Es handelt sich hierbei also um eine Vollerhebung. 

- Sample 2: Die Bände 254 (2005) bis 307 (2016) waren in digitaler Form verfüg- 
bar und wurden automatisiert heruntergeladen. Daraus wurde als Ergänzung 
zum ersten Sample eine Zufallsauswahl von 20 Bänden gezogen. Aus diesen 
20 Bänden wurden von A wiederum alle Diagramme, die in eine der Klassen 
fallen, extrahiert. Hierbei handelt es sich also um eine Stichprobe. 

— Die Bände 191 (1999) bis 253 (2004) wurden ignoriert. 
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Aufgrund der von A und B erstellten Anleitung klassifizierte C alle Dia- 
gramme. Dabei galt: 


Wenn der gleiche Diagrammtyp im gleichen Band mehr als dreimal vor- 
kommt, wird er nur einmal erfasst und das Mehrfachvorkommen notiert: 
bis zur zehnfachen Verwendung wird die genaue Anzahl erfasst, danach 
in Zehnerschritten und ab 100 in Hunderterschritten geschätzt. 
Grundsätzlich wurde unterschieden, ob das Diagramm im weitesten Sinn 
in einem Bezug zu Sprache und Kommunikation steht oder nicht. Dazu 
ein Beispiel: Kein Bezug zu Sprache und Kommunikation haben etwa 
Tabellen, die die Parteizusammensetzung im Parlament wiedergeben. 
Sie hätten einen Bezug, wenn z.B. die Anzahl Redebeiträge der Parla- 
mentarier/innen aufgeführt wären. Für die weitere Analyse wurden nur 
Diagramme mit Bezug zu Sprache und Kommunikation berücksichtigt. 
Ebenfalls nicht berücksichtigt wurden alle Arten von Fotos, Illustratio- 
nen etc., die keinen Diagramm-Charakter haben, auch wenn sie Untersu- 
chungsmaterial abbilden (z.B. Plakate, Fotos von Text etc.). Die Abgren- 
zung lässt sich rechtfertigen, da z.B. bei einem Transkript oder einen 
Textbeleg (die aufgenommen wurden) eine (auch) minimale diagramma- 
tische Transformation erfolgt ist, während Abbildungen von Text, z.B. 
eines Flugblattes oder einer Buchseite, diesen so weit wie möglich 1:1 
abbilden wollen, also eine Faksimile-Darstellung anstreben. 


Tabelle 2 gibt eine Übersicht der erfassten Diagramme in den beiden Samples. Bei 
den genannten Zahlen wird nicht berücksichtigt, wenn der gleiche Diagrammtyp 
mehrfach vorkam, sondern sie geben die tatsächlich extrahierten und klassifi- 
zierten Diagramme wieder. 

In den weiteren Ergebnisdarstellungen werden zwei Zählungen unterschie- 
den, um die Schätzungen bei mehrfach vorkommenden Diagrammen des glei- 
chen Typs zu integrieren: 

Diagrammperspektive: Schätzungen werden mit den Häufigkeiten verrech- 
net. Es kann dann nicht mehr zwischen genauen Häufigkeitsangaben und 
Schätzungen unterschieden werden, weshalb alle Häufigkeitsangaben (auch 
in aggregierter Form pro Jahr, Jahrzehnt etc.) als Schätzungen betrachtet 


werden müssen. 


Bandperspektive: Es wird nicht die Anzahl der Diagrammtypen, sondern die 
Bände gezählt, in denen ein Diagrammtyp mindestens einmal vorkommt. Ein 
Band, in dem 100 Mal der gleiche Diagrammtyp vorkommt, unterscheidet 
sich dann nicht von einem, in dem der gleiche Typ nur einmal vorkommt. 
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Tab. 2: Ausgewählte Diagramme pro Jahr in der RGL 


Sample 1 

1975 54 1985 49 1995 239 
1976 8 1986 155 1996 311 
1977 92 1987 158 1997 144 
1978 151 1988 141 1998 3 
1979 88 1989 105 Summe 3330 
1980 66 1990 288 

1981 149 1991 135 

1982 90 1992 336 

1983 124 1993 212 

1984 81 1994 151 

Sample 2 

2005 101 2009 89 2015 103 
2006 37 2010 98 2016 5 
2007 21 2011 11 Summe 540 
2008 57 2012 18 


Summe Sample 1 und 2 3870 


Beide Perspektiven haben ihre Berechtigung, da sich mit ihnen leicht unter- 
schiedliche Fragen beantworten lassen: Mit der Diagrammperspektive erhält 
man einen besseren Überblick über die Gebräuchlichkeit von Diagrammen in 
der Reihe generell. Dafür kommt es bei dieser Perspektive zu Clusterbildungen, 
da bei bestimmten Diagrammtypen (z. B. bei datenaggregierenden Diagrammen) 
anzunehmen ist, dass sie - wenn sie in einem Band verwendet werden - gleich 
mehrfach verwendet werden. Um diesen Effekt zu korrigieren, kommt alternativ 
die Bandperspektive zum Zug. 

Weiter muss angemerkt werden, dass sich die beiden Samples 1 und 2 unter- 
scheiden, da ersteres eine Vollerhebung darstellt, letzteres eine Stichprobe, die 
38 % der Bände (20 von 53) umfasst. Deswegen werden bei zeitlichen Gliederun- 
gen die Häufigkeiten in Relation zu den Anzahl Bänden gesetzt. 
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2.4.2 Diagrammtypen 


Zunächst interessierte uns ein generalisierender Zugriff auf die in der RGL vor- 
kommenden Diagrammtypen. So zeigt Abbildung 13 die am häufigsten vorkom- 
menden Diagrammtypen in den Daten. 

Zu den häufigsten Diagrammtypen gehören Tabellen, verschiedene Graph- 
darstellungen, insbesondere Baumgraphen, und die Gruppe der Transkripte/ 
Dialoge/Textbelege. Zudem werden oft Pfeile integriert und es gibt insgesamt 
etwa 85 Diagramme, die wir als Sonderform klassifizierten. 


Typ 


Weitere: Sonderform ~ 


Weitere: Pfeil 


Weitere: MathFormelhaft 


Weitere: KWIC 


Weitere: Transkript/Dialog ~ 


Weitere: Venn 


Achsen: Karte 
Achsen: Punkt ~- 


Achsen: Linien ~ 


Achsen: Kreis 


Achsen: Balken 
Graph: Anderes 


Graph: Dreieck - 


Graph: Fluss 


Graph: Netz 


Graph: Baum 


Tab: Andere ~ 


Tab: Zahlen 


BR 
Vs 
o 


100 


O= 
uw 
oO 


Anzahl Bande mit diesem Typ (Mehrfachklassifikationen méglich) 


Abb. 13: Übersicht der vorkommenden Diagrammtypen in den RGL-Bänden 1 (1975) bis 307 
(2016) 
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Typ 


Weitere: Sonderform 
Weitere: Pfeil 

Weitere: MathFormelhaft 
Weitere: KWIC 

Weitere: Transkript/Dialog 


Weitere: Venn 


Achsen: Karte Legende 


(Jahrzehnt) 


E 2010 
BB 2000 
BE 1990 


1980 
1970 


Achsen: Punkt 


Achsen: Linien 


Achsen: Kreis 


Achsen: Balken 


Graph: Anderes 


INN 


Graph: Dreieck 
Graph: Fluss 
Graph: Netz 
Graph: Baum 


Tab: Andere 


r 

o E 

m —— 
C 
e 


Tab: Zahlen 


0 25 50 75 


Relative Anzahl Bände mit diesem Typ in % (Mehrfachklassifikationen möglich) 


Abb. 14: Übersicht zur zeitlichen Verteilung der Diagrammtypen in den RGL-Bänden 1 (1975) bis 
307 (2016) (Bandperspektive; Daten = alle Diagramme, n = 2173) 


Wie sieht nun diese Verteilung aus der Perspektive der zeitlichen Entwicklung 
aus? Abbildung 14 gibt darüber Auskunft und untergliedert die Häufigkeiten nach 
Jahrzehnten, wobei berücksichtigt werden muss, dass die 2000er- und 2010er- 
Jahrzehnte jeweils nur von 2005 bis 2009 bzw. 2010 bis 2016 reichen und eine 
Stichprobe von 20 Bänden darstellen, da der Zeitraum von 1999 bis 2004 nicht 
analysiert wurde und der letzte analysierte Band von 2016 stammt. 

Wenn man die „Bandperspektive“ einnimmt (vgl. oben Abschnitt 2.4.1), dann 
werden folgende Entwicklungen sichtbar: 
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- Folgende Typen nehmen zu (Anteil der Bände, in denen solche Typen ver- 
wendet werden): Tabellen, Netzgraphen, Dreieckgraphen, Balken-, Linien- 
und Punktdiagramme, Karten, Transkripte/Dialoge/Textbelege, KWiCs. 

- Alle anderen Typen bleiben mehr oder weniger stabil: Baum- und Flussgra- 
phen, andere Graphen, Kreisdiagramme, Venn-Diagramme, mathematisch 
Formelhaftes, Pfeile, Sonderformen. 


Die starke Zunahme der Achsendiagramme und KWiCs relativiert sich etwas, 
wenn man den relativen Anteil der Diagramme pro Jahrzehnt verwendet 
(geschätzte Frequenzen, vgl. oben Abschnitt 2.4.1), wie Abbildung 15 zeigt. Die 
Anteile der genannten Typen an allen Diagrammen verändert sich nicht stark. 
Das liegt daran, dass die Verwendung von Tabellen sich mit einem Clustereffekt 
bemerkbar macht: Wenn Tabellen verwendet werden, dann gleich mehrfach. Der 
Anteil der anderen Diagramme sinkt dann. Bei der Bandperspektive jedoch wird 
dieser Clustereffekt korrigiert. 


2.4.3 Diagrammfunktionen 


Unterscheidet man die verwendeten Diagramme nach den unterschiedlichen 
Funktionen, bzw. deren unterschiedlichen Referenten, lassen sich die gewon- 
nenen Erkenntnisse weiter differenzieren. Die Abbildungen 16 und 17 geben 
zunächst einen Überblick (s.u., S. 70). Aus der Diagrammperspektive (Abbil- 
dung 16) überrascht, dass die Mehrheit der Diagramme auf ein theoretisches 
Modell referieren. Dies relativiert sich wiederum etwas mit der Bandperspektive 
(Abbildung 17). Das bedeutet: Wenn in einem Band ein theoretisches Modell dar- 
gestellt wird, finden sich meist auch weitere davon. Bei Diagrammen, die empi- 
rische Daten darstellen (zusammenfassend oder „roh“), ist das weniger der Fall. 

Ignoriert man diesen Clustereffekt und nimmt die Bandperspektive ein, istein 
deutlicher Anstieg von Bänden zu verzeichnen, die mindestens ein oder mehrere 
Diagramme enthalten, die Daten zeigen. Die Zeit von 2005 bis 2016 unterscheidet 
sich in dieser Hinsicht deutlich von den vorherigen Jahrzehnten. In neuerer Zeit 
enthalten also etwa 85 % aller Bände mindestens ein Diagramm, das Daten zeigt. 

Über die Anzahl der Diagramme hinweg gesehen, ist es aber auch so, dass 
Diagramme, die auf theoretische Modelle referieren, im Laufe des Untersu- 
chungszeitraums leicht abnehmen. Machen bis 1998 solche Diagramme noch um 
die 50% aller Diagramme aus, beträgt dieser Anteil 2016 unter 40%. Trotzdem 
ist es erstaunlich, dass Diagramme zur Anzeige empirischer Daten nicht deutlich 
häufiger sind. 
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Typ 


Weitere: Sonderform 
Legende 


(Jahrzehnt) 


E 2010 
BB 2000 
BE 1990 


1980 
1970 


Weitere: Pfeil 
Weitere: MathFormelhaft 
Weitere: KWIC 


Weitere: Transkript/Dialog 


Weitere: Venn 


Achsen: Karte 
Achsen: Punkt 
Achsen: Linien 
Achsen: Kreis 
Achsen: Balken 
Graph: Anderes 
Graph: Dreieck 
Graph: Fluss 
Graph: Netz 
Graph: Baum 
Tab: Andere 


Tab: Zahlen 


0 10 20 30 


Relative Anteile aller Diagramme pro Jahrzehnt in % (Mehrfachklassifikationen möglich) 


Abb. 15: Übersicht zur zeitlichen Verteilung der Diagrammtypen in den RGL-Bänden 1 (1975) bis 
307 (2016) (Diagrammperspektive; Daten = alle Diagramme, n = 2173) 


2.4.4 Diagrammtypen in Abhängigkeit von Diagrammfunktionen 


Die Entwicklung der Diagrammtypen soll nun spezifiziert nach Diagrammfunkti- 
onen analysiert werden. 

Abbildung 18 (s.u., S. 71) zeigt die zeitliche Entwicklung der Typen für 
Diagramme, die einen Datenbezug haben (aggregierte Daten oder Rohdaten). Es 
wird deutlich, dass in diesem Feld Bände häufiger geworden sind, die Diagramme 
der folgenden Typen enthalten: Tabellen, andere Graphen, Balken-, Linien und 
Punktdiagramme, Karten, Transkripte/Dialoge/Textbelege, KWiCs und Sonder- 
formen. Das ist erwartbar, da es sich bei den genannten Typen entweder um 
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Funktion 


theoretisches Modell 


Legende 
(Jahrzehnt) 


E 2010 
2000 
BE 1990 


1980 
1970 


Anwendung eines Modells 


fasst Daten zusammen 


Daten 


Relative Anzahl Diagramme mit diesem Typ in % (Mehrfachklassifikationen möglich) 
Abb. 16: Zeitliche Verteilung der Diagrammfunktionen in den RGL-Bänden 1 (1975) bis 307 


(2016) (Diagrammperspektive) 


Funktion 


theoretisches Modell 


Legende 
(Jahrzehnt) 


E 2210 
BB 2000 
BE 1990 


1980 
1970 


Anwendung eines Modells 


fasst Daten zusammen 


Daten 


Relative Anzahl Bände mit dieser Funktion in % (Mehrfachklassifikationen möglich) 


Abb. 17: Zeitliche Verteilung der Diagrammfunktionen in den RGL-Bänden 1 (1975) bis 307 
(2016) (Bandperspektive) 


generell häufige Diagrammtypen für empirische Daten handelt oder um solche, 
die in der Linguistik typischerweise dafür verwendet werden. Jedoch ist auffällig, 
dass Netzgraphen in der RGL offensichtlich nicht für die Darstellung von Daten, 
sondern von Modellen verwendet werden. 
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Typ 

Weitere: Sonderform 
Weitere: Pfeil 

Weitere: MathFormelhaft 
Weitere: KWIC 

Weitere: Transkript/Dialog 
Weitere: Venn 


Achsen: Karte 


Legende 
(Jahrzehnt) 


H 2010 
E 2000 
BE 1990 


1980 
1970 


Achsen: Punkt 
Achsen: Linien 
Achsen: Kreis 


Achsen: Balken 


Graph: Anderes 


Graph: Dreieck 
Graph: Fluss 
Graph: Netz 
Graph: Baum 
Tab: Andere 


Tab: Zahlen 


0 25 50 75 


Relative Anzahl Bände mit diesem Typ in % (Mehrfachklassifikationen möglich) 


Abb. 18: Zeitliche Verteilung der Diagrammtypen mit generellem Datenbezug in den RGL-Bän- 
den 5 (1977) bis 307 (2016) (Bandperspektive; Daten = Datenbezug: Daten generell, n = 581) 


Nimmt man wiederum die Diagrammperspektive ein, relativiert sich das Bild 
wiederum insofern, dass sich die Anteile der oben genannten Typen an allen 
Diagrammen nicht stark verändert. Am Beispiel der Balkendiagramme exempli- 
fiziert, bedeutet dies, dass deren Anteile an allen Diagrammen zwischen 10 und 
15% von 1975 bis 2016 schwankt. Gleichzeitig steigt aber der Anteil der Bände, 
die diesen Diagrammtyp generell verwenden. D. h. es gibt einen Trend, in einem 
Buch mindestens ein Balkendiagramm zu verwenden - aber eben eher nur eines 
statt vieler. Daraus lässt sich die Hypothese ableiten, dass ein Trend zu mehr 
quantitativer Empirie dazu führt, für die Darstellung von linguistischen Studien 
wenigstens ein Balkendiagramm zu verwenden, jedoch nicht ausführlich empi- 
rische Daten mit Diagrammen zu visualisieren. Interessanterweise finden sich 
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Typ 


Weitere: Sonderform 


Weitere: Pfeil Legende 


(Jahrzehnt) 


E 2010 
E 2000 
BE 1990 


1980 
1970 


Weitere: MathFormelhaft 
Weitere: KWIC 
Weitere: Transkript/Dialog 


Weitere: Venn 


Achsen: Karte 
Achsen: Punkt 
Achsen: Linien 
Achsen: Kreis 
Achsen: Balken 
Graph: Anderes 
Graph: Dreieck 
Graph: Fluss 
Graph: Netz 
Graph: Baum 
Tab: Andere 


Tab: Zahlen 


0 20 40 60 


Relative Anzahl Bande mit diesem Typ in % (Mehrfachklassifikationen möglich) 


Abb. 19: Verwendung von Diagrammen fiir die Darstellung von aggregierten empirischen Daten 
in den RGL-Bänden 5 (1977) bis 307 (2016) (Bandperspektive; Daten = Datenbezug: aggregierte 
Daten, n= 480) 


auch selten Punkt- oder Streudiagramme, die beispielsweise in deutlich quanti- 
tativ-empirischen (Teil-)Disziplinen häufig sind. 

Wenn in der Linguistik empirische Rohdaten diagrammatisch dargestellt 
werden, dann in Texttabellen und Transkripten/Dialogen/Textbelegen. Für 
aggregierte Daten werden in erster Linie Tabellen (Zahlen und Text), Balken- und 
Liniendiagramme verwendet (vgl. Abbildung 19). 

Betrachtet man sich die diagrammatische Darstellung von theoretischen 
Modellen, sind generell Texttabellen, Graphen (alle Formen) sowie Sonderfor- 
men und Pfeile häufig — in mehr als 40% aller Bände finden sich im Schnitt 
solche Diagramme (vgl. Abbildung 20). Graphdarstellungen werden in der RGL 
also nicht dafür verwendet, Netzwerkanalysen o.ä. durchzuführen, sondern the- 
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Typ 
Weitere: Sonderform 


Weitere: Pfeil 


Weitere: MathFormelhaft 
Legende 
(Jahrzehnt) 


E 2010 
BB 2000 
BE 1990 


1980 
1970 


Weitere: KWIC 
Weitere: Transkript/Dialog 
Weitere: Venn 


Achsen: Karte 


Achsen: Punkt 


Achsen: Linien 
Achsen: Kreis 
Achsen: Balken 
Graph: Anderes 
Graph: Dreieck 
Graph: Fluss 
Graph: Netz 
Graph: Baum 
Tab: Andere 


Tab: Zahlen 


0 20 40 60 


Relative Anzahl Bande mit diesem Typ in % (Mehrfachklassifikationen möglich) 


Abb. 20: Diagramme, die theoretische Modelle repräsentieren, in den RGL-Bänden 1 (1975) bis 
303 (2015) (Bandperspektive; Daten = repräsentiert Modell, n=1107) 


oretische Modelle zu repräsentieren, die beispielsweise komplexe Zusammen- 
hänge verdeutlichen sollen (vgl. Abbildungen 21 und 22 für Beispiele, S. 74). 

Generell ist festzuhalten, dass in der RGL im Bereich des Typus theoretische 
Modelle und deren Anwendung eine große Vielfalt an Diagrammen zu finden ist, 
was sich auch am hohen Anteil der von uns als Sonderformen klassifizierten Dia- 
gramme (vgl. Abbildung 13) zeigt. Dabei kommt es auch oft zu Kombinationen 
verschiedener Diagrammtypen, wie Abbildung 23 zeigt (s. u., S. 75). 

Immer wieder kommt es auch zu Zitationen bestehender Diagramme (vgl. 
Abbildung 24, S. 75). Insgesamt finden sich in unseren Daten 248 Beispiele 
für zitierte Diagramme, wobei das „Toulminschema“ zur Darstellung von Argu- 
mentationsstrukturen (Toulmin 1958, 101) mit zehn und Tesniéres Dependenz- 
schema (Tesniére 1953, 14) mit fünf Zitationen an der Spitze stehen. Allerdings 
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Die wechselseitige Verflochtenheit dieser Konstellationen vermag die folgende 
Graphik zu veranschaulichen: 


ROLLENPERFORMANZ SPEZIELLE MOTI- 
VIERTHEIT 


a Teinameram |] 


Abb. 6: Redekonstellationsverflechtung 


Abb. 21: Beispiel fiir eine Graphdarstellung eines theoretischen Modells (Stellmacher 1981, 77) 


Diagramm 7: 


Erläuterung: —» Verfahren (1),(2); =--> Verfahren (3) 


Abb. 22: Beispiel für ein Flussdiagramm („Verlaufsdiagramm“) zur theoretischen Modellierung 
einer turn-Organisation - klassifiziert als Anwendung eines Modells (Redder 1984, 127) 
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Elementares Modell des Zusammenspiels von Verstehensfaktoren 


Welt möglicher Geschichten/Tatsachenzusammenhänge 


S = Sprecher B = Besprochenes Z, = Zeichen im gemeinsam 
A = Angesprochener RB, = Besprochenes in der geteilten Sprachhesity 
H = Horizont Situation von S and A 

Hy = Horizont des Sprechers B, = Besprochenes im Z, = Zeichen im Sprach- 
H, = Horizont des Angesprochenen gemeinsam geteilten besitz von $ 

SB = Sprachbesitz Horizont von $ und A TEXT = Text als geordnete 
SB, = Sprachbesitz des Sprechers B, = Besprochenes im Anweisungsmenge 
SB, = Sprachbesitz des Horizon von $ Te = Textelement 

Angesprochenen Z = Zeichen KT = Konten 


Abb. 23: Beispiel für ein Venn-Diagramm mit Integration eines Graphen zur Repräsentation 
eines Modells des Zusammenspiels von Verstehensfaktoren (Scherner 1984, 85) 


Hochsprache 


A 


Regionale 
Umgangssprache 


Soziale Schicht 


Dialekt 


Abb. 9 Die kommunikative Reichweite der Gemeinsprache, der 
Umgangssprache und des Dialekts in Österreich [= König (1978), 132] 


Abb. 24: Beispiel für eine Kombination von Karte und dreidimensionalem Venn-Diagramm und 
gleichzeitig eine Zitation des Diagramms (Wells 1990, 393), Originaldiagramm bei König (1978, 
132) 
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Tabelle 9: Prozentualer Anteil der zitierten Sprecheinheiten eines 
jeden in Zeit : 


(Länge des Diagrams = 100%) 


ion aed 
_ 
St 
st 


Abb. 25: Beispiel fiir ein Diagramm mit Datenbezug (Zusammenfassung als eine Art Mosaik- 
Plot) (Hoppenkamps 1977, 216) 


ist die Datengrundlage zu klein, um zur visuellen Zitationspraxis repräsentative 
Aussagen machen zu können. 

Obwohl Modelle repräsentierende Diagramme in der RGL in der Mehrzahl 
sind, finden sich auch Diagramme mit Datenbezug, die über klassische Achsen- 
diagramme hinaus gehen. Abbildung 25 zeigt ein solches Beispiel; eine Art gesta- 
peltes Balkendiagramm, das aber an eine Frühform eines sogenannten Mosaik- 
Plots erinnert (Hartigan/Kleiner 1981). 

Ein anderes Beispiel avancierter statistischer Analyse zeigt Abbildung 26. Der 
Beitrag von Karl Heinz Wisotzki mit dem Titel „Einsatz des Computers in Sprach- 
und Sachunterricht bei Hörgeschädigten“ berichtet von einem Experiment mit 
einer Versuchs- und Kontrollgruppe und nutzt statistische Methoden, um eine 
Korrelation zwischen Computereinsatz und Lernerfolg zu prüfen. Sowohl Text- 
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duktus als auch Präsentationsart sind deutlich sozialwissenschaftlich geprägt 
und es werden auch die entsprechenden Diagramme verwendet. Solche Analysen 
sind nicht repräsentativ für die Arbeiten in der RGL. 


108 


Es wurden folgende Untersuchungsvariablen Überprüft: Ted. 4: 

- die fähigkeit der Schüler, schriftliche Fregen zum Unterrichts- an 
stoff aus einen naturwissenschaftlichen Fach schriftlich zu 
beantworten, und die Art und Anzahl der syntaktischen Fehler 
in den Antworten, 

- die Fähigkeit der Schüler, nonverbale Testeufgaben zum Unter- 
Fichtestoff aus eines naturmissenschaftlichen Fach zu 
bearbeiten. 


‘ 
fies 
LEDIA 


Die Überprüfungen wurden als Prě- und Posttest durchgeführt, und 
zwar jeweils zu Beginn und zum Ende des Untersuchungszeitrauss, der 
ein Jahr betrug. Als unabhängige Variable gilt die Lehrmethodenzu- 
gehörigkeit, als die Zugehörigkeit zu einer Klasse, in der mit oder 
ohne Computerunterstützung gearbeitet wird, wobei Computer- 
unterstützung bedeutet, daß innerhalb der Stundentafel für den 
Sachunterricht mit dem Computer an den vorgestellten Programmen ge- 
arbeitet wurde. 


Bsessssssess: 


SS b seu eueses 
ENEKSBRER 


Prütestvariable sind die nonverbalen Testleistungen sowie der 19. 
Posttestvariable sind die nonverbalen Testleistungen und die 
schriftlichen Testleistungen. Das Ergebnis zeigen die Tabellen J 


sRECT: Regressionstransformation 


Die Korrelation zwischen IQ und Text-Test für die Gesamtstichprobe 
(Ne 92) beträgt re 54. Die Korrelation zwischen dem Prätest und dem 


Text- REGI I-e RECTI- Text-Test beträgt re 0,52. Die relevanten Kriterien werden in der 
10 prë post Test 10 nonwerb. folgenden Grafik (Abb. 2) deutlicher. 
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Abb. 2: Zusammenhang von IQ und Text-Test 


Abb. 26: Zusammenspiel von Datentabellen und Diagramm zur Darstellung statistischer 
Analysen (Wisotzki 1989, 108-109) 


2.4.5 Kontextualisierung der RGL-Analyse 


In der RGL sind mehr Monographien als Sammelbände vorhanden. Dies lässt ver- 
muten, dass deshalb theoretische Ausführungen einen besonders großen Stel- 
lenwert einnehmen. Anders sieht deshalb das Bild aus, wenn man Publikationen 
und Reihen in den Blick nimmt, die von empirischen Studien berichten, wie etwa 
in der Korpuslinguistik.' 


11 Eine Zufallsauswahl von 60 Artikeln aus dem International Journal of Corpus Linguistics 
aus den Jahren 1996 bis 2016 zeigte, dass nur gerade 10 Artikel keinerlei Diagramme enthielten, 
wobei Tabellen und mathematische Formeln ebenfalls als Diagramme aufgefasst wurden. 
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Doch wie steht es um die Linguistik besonders beeinflussende Arbeiten? Wenn 
man sich die frühen sprachwissenschaftlich ausgerichteten Werke aus dem 17, 
18. und 19. Jahrhundert ansieht, finden sich darin nur wenige Diagramme, die 
tiber Listen und Tabellen hinaus gehen. Listen und Tabellen sind aber natiirlich 
wichtige diagrammatische Mittel, die das erwachte Interesse an einer rational- 
universalistischen Sprachtheorie (Gardt 2012, 207) widerspiegelten. Ein Bei- 
spiel dafür ist die „Grammaire générale et raisonnée“, die „Grammatik von Port 
Royal“ von Antoine Arnauld und Claude Lancelot von 1660 (Arnauld/Lancelot 
1660). Abbildung 27 zeigt zwei Beispiele aus dieser Grammatik: Eine Tabelle zur 
Darstellung des Personalpronomen-Paradigmas in den verschiedenen Kasusver- 
wendungen und rechts daneben eine Klassifikation von Präpositionen, die die 
Autoren einführen mit: 


Nous auons dit cy-deffus chap. 6. que les Cas & les Prepofitions auoient efté inuentez pour le 
mefme vfage, qui eft de marquer les rapports que les chofes ont les vnes aux autres. 

Ce font prefque les mefme rapports dans toutes les Langues qui font marquez par les 
Prepofitions. C eft pourquoy je me contenterey de rapporter icy les principaux de ceux 
qui font marquez par les Prepofitions de la Langue Francoife, fans m’obliger ä en faire vn 
dénombrement exact, comme il feroit neceffaire pour vne grammaire particuliere. 

Ie croy donc qu’on peut reduire les principaux de ces rapports à ceux[: ] (Arnauld/Lancelot 
1660, 83-84) 


Die Autoren stellen also eine Analogie zwischen der Funktion der Kasus und der 
Präpositionen her und schlagen eine Klassifikation vor, um die Fülle an Informa- 
tionen zu ordnen. Nach dieser Einleitung folgt dann das in Abbildung 27 rechts 
abgebildete Diagramm einer hierarchischen Liste in der Grundstruktur eines 
Baumes. Diese Liste ist dabei nicht nur eine Strukturierung für die französischen 
Pronomen, sondern beansprucht Universalität — „les mefme rapports dans toutes 
les Langues“. Die Autoren beschreiben als „les principaux“, ohne Vollständigkeit 
anzustreben - „fans m’obliger ä en faire vn denombrement exact“. Die diagram- 
matische Form ist in Kombination mit dem Inhalt also ein Schema, das auf die 
Klassifikation von Präpositionen in allen Sprachen und sogar zur Beschreibung 
von grammatischen Relationen generell abhebt. Damit wird das Diagramm zu 
einem grammatischen Strukturprinzip. 

Ähnliche Tabellen und Listen finden sich auch in anderen Werken mit uni- 
versalistischem oder sprachvergleichendem Anspruch, etwa in sprachvergleichs- 
grammatischen Überlegungen bei Wilhelm von Humboldt in „Über die Kawi- 
Sprache auf der Insel Java“ (Humboldt 1838). 

Allerdings stammen diese Darstellungen nicht von Humboldt selbst, sondern 
vom Herausgeber, Eduard Buschmann, der auch von den damit verbundenen 
Schwierigkeiten schreibt: 


ET RAISONNEE, $1 


— — 
AVANT LEs Varnas AY [Par TOVT AILLEVRS. 


Nominat. | Datif. | Accuf.' Ablarif.| Genitif.cps. | 


Ils elles} leur | les | eux elles 
— 


m. 


| Ie me | moy | 
— | 
| Tu te toy | 
{ihe f | 
| fe | foy 
[Ta ly en! lay die 
| 


Mais ily a quelques remarquesä faire fur 
cette Table, 

La 1. eft, que pour abreger je n'ay mis 
nous & vous qu'vne feule fois, quoy qu'il fe 
difent par tout auant les verbes, apres les 
verbes,& en tous les cas. C’eft pourquoy il 
n'y a aucune difficulté dans Je langage or- 
dinaire au pronom de la feconde perfonne, 
parce qu'on n'y employe que wous. 

La 2. eft, que ce que nous auons marqué 
comme le datif & l’accufatif du pronom it 


Abb. 27: Diagramme in der Grammatik von Port Royal (Arnauld/Lancelot 1660, 61, 84) 


Polynesisch. 


Delacaufe) materielle 
finale 


masima wal tahi| sal tal (rh wed) 
tahi, wig tote (Urn) 


mahána (nd Wis 
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34 GRAMMAIRE GENERALE 
cipaux de ceux qui font marquez pe les 
ac de la Langue Frangoife, fans 
m'o! 

exa& , commeil feroit neceflaire pour vne 
grammaire particuliere. 


liger à en faire vn dénombrement 


Ie croy donc qu'on peut reduire les prin- 


cipaux de ces rapports à ceux 


dans left dams Paris. 
en left en Italie. 
a Theft à Rome. 


De lieu, de hors  Certte maifon eff bors la ville, 
gaa, froin Ief fur la mer, 


d'ordre, ous Toutce qui «ft fous le Ciel, 
aape 
a 'n tel ma s leRey, 

Sos Heft chig le wee p 


D 5 pends Ý s 
u tem; Pendant la guerre, 
Se t 


en Ilva en Ialie, 
“ a & Rome. 
als Pi vers L'aimae fi teurme vers le Nord, 
$ enuers Son amour enwers Diem. a 
que I'S quit de I! part de Parie. 
eficiente Evar Maifon baflie par vn archıreife 
le de pierre & de brique 
pour pour y lager. 
Vnion avec es faldarı ance lewrs0 ficiers. 
Separation fans les foldats fans leurs0 ficiers. 
exception outre Compans te Karl foldars 
u te 


eure 
Aue np: oppohition cötre sodas eg, contre leurs 


retrichemétde So'dars retrd hex duregimär. 
permutation pour rendre vn prifemuier pour um 


autre. 
conformité felon filon la raifen. 


— 79 


Abb. 28: Beispiel für eine Tabelle (Ausschnitt) für den Sprachvergleich anhand ausgewählter 


Lexeme (Humboldt 1838, 241) 
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Die Reihenfolge, in welcher man die neun hier aufgestellten Sprachen geordnet findet, 
habe ich selbst bestimmen müssen. Die Aufgabe war von der Art, dafs sie sich jetzt noch in 
keiner Weise genügend lösen liefs. Es hätte allein schon die grofse Hauptfrage entschieden 
sein müssen, ob der mehr vollkommene Wortbau des westlichen Stammes als successiv aus 
dem auf die gröfste Einfachheit und Dürftigkeit herabgehen den des Polynesischen durch 
Anwachs entstanden anzunehmen sei, ob man in der letzteren grofsen Familie wirklich die 
so weit verzweigte Sprache mehr in dem Zustande ihrer Entstehung, in der Kindheit stehen 
geblieben, erkennen solle, oder ob der Urtypus vielmehr in den vollkommneren Spra- 
chen des Westens zu suchen sei, deren Laut- und Formenfülle von einem mit dürftigeren 
Articulations-Fähigkeiten begabten kindlichen Volke überall beschnitten und vereinfacht 
wurde, oder, da man bestimmt weder diese, noch jene Thatsache ausschliefslich und in 
ihrem Extreme wird beglaubigen können, inwieweit man das Eine und das Andere im All- 
gemeinen und im Einzelnen werde annehmen dürfen. (Buschmann in Humboldt 1838, 237) 


Eindrücklich wird hier deutlich, dass die diagrammatische Transformation dazu 
zwingt, eine Reihenfolge festzulegen — die zudem eine dahinterliegende, aus 
heutiger Perspektive mehr als streitbaren Ideologie freilegt -, die im Original 
offener war, und wie damit eine nebensächlich erscheinende diagrammatische 
Umsetzung Tatsachen schafft. 

Dieses Phänomen ist auch bei Ferdinard de Saussure sichtbar. Saussu- 
res posthum veröffentlichtes Werk „Cours de linguistique générale“ (Saussure 
1916) stammen nicht aus der Feder Saussures, sondern derer seiner Herausge- 
ber Charles Bally und Albert Sechehaye (Gardt 2012, 289). Die Diagramme aus 
dem „Cours“ sind jedoch ein prägendes Element der linguistischen Theoriebil- 
dung im 20. Jahrhundert, wie Sung-Do Kim konstatiert: „Le visualisme saussu- 
rien, encore a développer, sera un beau chapitre de la rhétorique saussuriennne 
(Kim 2008, 40). Aber auch die Diagramme sind nicht alle originär von Saussure. 
Zwar zeichnete er während seiner Vorlesung selbst Diagramme an die Wandta- 
fel und es finden sich in anderen Aufzeichnungen von Saussures Schülerinnen 
und Schülern Kopien davon, die Herausgeber Bally und Sechehaye veränder- 
ten jedoch die Diagramme oder ergänzten sie (Joseph 2017, 148). John E. Joseph 
zeigt dies an mehreren Beispielen, so etwa an der viel zitierten Zeichnung des 
sprachlichen Zeichens mit „Concept“ und „Image Acoustique“ bzw. „Signifie“ 
und „Signifiant“. Im von Bally und Sechehaye herausgegeben „Cours“ findet sich 
neben diesem zwei weitere Varianten, eine mit „arbre“ in Anführungszeichen als 
Konzept und „arbor“ ohne Anführungszeichen als Lautbild und eine Variante, 
bei der das Konzept durch die Zeichnung eines Baumes ersetzt ist. Doch: 


The students’ notes do not have this trio of diagrams, just a single one [...]. Crucially, Saus- 
sure did not draw the linguistic sign containing the picture of the tree: he used the tree and 
horse pictures only to illustrate the nomenclaturism that he rejected. In creating the right- 
hand illustration of the sign with the picture representing the signified, the editors opened 
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up a Pandora’s box of contrapuntal readings [...]. More than that: many readers have come 
away from the CLG with the understanding that the signified in this sign is not a pure value, 
not a concept, not even a picture ofa tree, but actual trees. (Joseph 2017, 158) 


Eine solche Interpretation würde im Konzept dann aber einen Referenten sehen, 
also gerade nicht, was Saussure wohl beabsichtigte.” 

Ein wichtiger Paradigmenwechsel in der Linguistik geschieht Ende des 19. 
und dann im 20. Jahrhundert mit der Pragmatik. Also der Vorstellung, Sprache 
in Abhängigkeit von Sprecher/innen und Hörer/innen und damit als sozial ver- 
fasst zu konzipieren (Gardt 2012, 339ff.). Diese Überlegungen gehen auf Charles 
Sanders Peirce zurück und werden etwa von Charles William Morris, Karl Bühler, 
Ludwig Wittgenstein, John Austin und John Searle geprägt. Diagrammatisch spie- 
gelt sich diese Entwicklung darin wider, dass „flache“ Darstellungen von sprach- 
lichen Strukturen, wie etwa in Paradigmen abbildenden Tabellen oder Listen 
(vgl. z.B. die Grammatik von Port Royal oben), in triadische Formen überführt 
werden. Das semiotische Dreieck, zuerst bei Charles Kay Ogden und Ivan Arm- 
strong Richards (1923) und später bei Charles William Morris (1938), bricht die 
Diade zwischen Bezeichnendem und Bezeichnetem auf. Bei Ogden und Richards 
mit der „reference“, dem Bewusstseinsinhalt, bei Morris mit dem Interpretan- 
ten. Natürlich ist diese Triade bereits bei Peirce angelegt (Nagl 1992) und geht 
in ihrer Tradition auf Platon zurück (Gardt 2012, 340). Das gezeichnete Dreieck 
aber erweist sich als Diagramm produktiv, da es vielfach aufgenommen wird, 
und leitet viele weitere Zeichenbegriffe. Eco (2002, 69) sieht das von Ogden und 
Richards in die Welt gesetzte Schema allerdings als „äußerst schädlich“: 


Abgesehen von der Tatsache, daß das Dreieck den Gedanken nahelegt, daß im Signifika- 
tionsverhältnis drei Größen auftreten (während doch, wie wir sehen werden, weit mehr 
Größen darin verwickelt sind und das Dreieck einem komplexen Polyeder weichen müßte), 
ist der Schaden, den das Dreieck der Semiotik zugefügt hat und immer noch zufügt, der, 
daß es die Auffassung perpetuiert (für die Frege der Hauptverantwortliche ist), die Bedeu- 
tung eines Ausdrucks hätte etwas mit der Sache zu tun, auf die der Ausdruck sich bezieht. 
(Eco 2002, 69-70) 


Dies ist ein weiteres Beispiel dafür, wie eine diagrammatische Form dafür verant- 
wortlich gemacht wird, eine falsche Idee wirkungsvoll zu verbreiten. 


12 Ein weiteres prominentes Beispiel für das Eigenleben einer Visualisierung bietet August 
Schleichers Baumdiagramm der Sprachfamilien. Darauf bin ich in Abschnitt 2.3.3 schon zu spre- 
chen gekommen und werde dies im Zusammenhang mit Baumgraphen in der Linguistik noch 
vertiefen (Abschnitt 5.5.2). 
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THOUGHTS, WORDS AND THINGS n 


effect of our symbols on other persons, and our own 
attitude. When we hear what is said, the symbols 
both cause us to perform an act of reference and to 
assume an attitude which will, according to circum- 
stances, be more or less similar to the act and the 
attitude of the speaker. 


Between the Thought and the Referent there is also 
a relation ; more or less direct (as when we think about 
or attend to a coloured surface we see), or indirect (as 
when we ‘think of" or ‘refer to" Napoleon), in which 
case there may be a very long chain of sign-situations 
intervening between the act and its referent: word— 
historian—contemporary record—eye-witness—referent 
(Napoleon). 
Between the symbol and the referent there is no 
relevant relation other than the indirect one, which 
consists in its being used by someone to stand for a 4 
referent. Symbol and Referent, that is to say, are not SEMIOSE 
connected directly (and when, for grammatical reasons, SEMIOTIK | 
we imply such a relation, it will merely be an imputed,’ I | 


. wes | | 
a I SYNTAKTIK SEMANTIK PRAGMATIK 


Abb. 29: Die semiotischen Dreiecke von Ogden/Richards (1923, 11) und Morris (1938, 94) 


Wir haben nun am Beispiel der vorgenommenen Analysen einen Finblick in die 
diagrammatische Praxis in der Linguistik gewonnen. In Kapitel 5 zu den diagram- 
matischen Grundfiguren werde ich einige Beobachtungen aufgreifen, um durch 
eine systematische Bestimmung die für die Linguistik wichtigsten Grundtypen zu 
bestimmen. 

Zunächst möchte ich aber grundsätzlicher auf die Praxis im Umgang mit Dia- 
grammen in der Linguistik eingehen. 


3 Diagramme als Transformationen 


3.1 Visualisierungen als Zeichen und als Praxis 


[142] 

f2 jahre de fakto;=und da drüber brauchen wir jetzt gar ned lang diskutieren- 
m2 ((klopft auf pult, senkt blick, 
? ( ) 

[143] 

f2 (.) weil wenn die komission in ihrer WUNderbaren vielfalt nach 6 jahren beschliesst, dass 


m2 bläst luft aus, blickt sie wieder an)) 


12 sie alle noch VI:EL lieber und noch VI:EL billiger bei uns durchfahren 
mi <<all>kann sie gar nicht> 

m2 hehehe 

? (aso) 


12 möchten, (.) ä:h dann sind WIR der billige jakob? (.) 
mi ((grinst)) 
m2 frau lichtenberger ich schätze sie 


f2 <<wehrt ausserungen gestisch ab>na bitte do (redens) mer da jetzt nit rein?> dann (-) sein 
m2 machen wir (kei innerpolitisches parkett da); ((grinst, senkt 


f2 mir der billige jakob von OSCHterreich? (-) wir haben nicht einmal eine geringfügige 
m2 blick, lehnt sich zurück)) 


Abb. 30: Diagramm 


Das Diagramm in Abbildung 30 ist für eine Linguistin oder einen Linguisten 
sofort als Gesprächstranskript erkennbar: Es handelt sich um ein transkribier- 
tes Gespräch zwischen mindestens vier Personen, das gemäß GAT-Konvention 
(Selting et al. 1998) in sogenannter Partiturschreibweise codiert worden ist. Für 
linguistische Laien wird das Diagramm etwas schwieriger zu deuten sein, dank 
bekannten Vorlagen aus dramatischen Dialogen jedoch ebenfalls als Gespräch 
identifiziert werden können. Ohne Zweifel bedürfen Diagramme jedoch oft eines 
kontextualisierenden Textes, um verstanden zu werden. Es gibt sogar Bilder, 
die erst durch den sie umgebenden Text ‚lesbar‘ werden (Goodman/Elgin 1989; 
Schneider 2008, 231; Stöckl 2004, 253). Diagramme sind in „enger Liaison“, 
„text-verankert“, „text-gebunden“: „Das Diagramm als einzelnes Bild, als text- 
unabhängige autonome Form von Bildlichkeit, die ohne Worte auskommt, gibt es 
nicht“ (Krämer 2016, 60-61). Gerade meine Zweckentfremdung des Gesprächs- 
transkripts im Kontext einer Studie verdeutlicht dies: Die Bildlegende „Abbil- 
dung 30: Diagramm“ (anstelle etwa einer Legende wie „Abbildung 30: Ausschnitt 


@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https://doi.org/10.1515/9783110698732-003 
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des Gesprächs“) macht aus dem Gesprächstranskript kein Zeugnis einer linguisti- 
schen Analyse eines Gesprächs, sondern verdeutlicht die metadiagrammatische 
Verwendung, bei der das Diagramm auf sich selbst verweist, um beispielhaft ein 
linguistisches Diagramm zu zeigen. 

Es scheint mir fruchtbar, hier mit dem Konzept der „transkriptiven Verfahren“ 
von Jäger (2004, 2005, 2007, 2010) anzuschließen. Jäger nimmt den Gedanken der 
Unhintergehbarkeit von Medien auf und beschreibt die unablässigen Bezugnah- 
men von Medien auf andere Medien und von Zeichen eines Zeichensystems auf 
andere Zeichen mit Verfahren der Transkriptivität, mit der Zeichen transformiert 
werden: 


Transkription stellt - kurz gesagt — ein grundlegendes sinninszenierendes Verfahren der 
kulturellen Semantik dar, das einmal die intramediale rekursive Selbstbezüglichkeit von 
Medien und zum andern die intermediale Kopplung differenter medialer Skripturen nutzt, 
um den symbolischen Welterzeugungsapparat in Gang zu halten. (Jäger 2007, 13) 


Skripturen sind somit zu verstehen als symbolische Strukturen, die in transkrip- 
tiven Verfahren entstehen, also Texte, Bilder, Musik, Filme, die ganze Palette 
an Medien, die über Remediatisierungen (Bolter/Grusin 2000) Übersetzungen, 
Umgestaltungen und Umformungen erfahren. Das transkriptive Verfahren der 
Paraphrasierung erzeugt mit dem Text als Paraphrase ein „Script“ und konsti- 
tuiert damit gleichzeitig den paraphrasierten Text als „Präscript“. Ähnlich ver- 
haltet sich die bildliche Wiederaufnahme eines Motivs in einem neuen Bild oder 
auch die TV-Übertragung eines Theaterstücks, wobei die Aufführung des Theater- 
stücks für sich genommen bereits eine Transkription ist, bei der sich der zugrun- 
deliegende Text als Präscript konstituiert. Es wird deutlich, dass transkriptive 
Verfahren zum Motor der Sinnerzeugung werden: 


Die transkriptive Logik der medialen Kommunikation ist es, die es Kulturen erlaubt, unles- 
bares Wissen lesbar zu machen bzw. lesbares Wissen zu arkanisieren, die es erlaubt, tra- 
dierte Semantik zu enteignen und neue Semantiken und Ästhetiken zu generieren; sie ist 
es, die den Zugriff auf die in den kulturellen Archiven stillgestellte Semantik ermöglicht und 
die es erlaubt, zwischen den Semantiken der multimedialen Kultur zu navigieren. (Jäger 
2007, 16) 


Wichtig im Zusammenhang mit Diagrammen ist Jägers Unterscheidung von 
inter- und intramedialen Verfahren: Verfahren, die sich innerhalb des gleichen 
Mediums ereignen und solche zwischen verschiedenen Medien (Jäger 2010). Das 
Medium Sprache ist ein Beispiel, in dem intramediale Verfahren stattfinden, da 
dort metakommunikative Prozesse, wie die bereits erwähnte Paraphrase, statt- 
finden können. Auf der anderen Seite ist das oben gezeigte Gesprächstranskript 
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ein Script, das über ein intermediales Verfahren entstanden ist, da das im Sym- 
bolsystem der Sprache stattgefundene Gespräch in die mediale Logik des Dia- 
gramms überführt worden ist.” „Intermedial“ trifft es jedoch nicht ganz, da das 
Gesprächstranskript ohne Zweifel starke Ähnlichkeiten mit dem Symbolsystem 
Sprache aufweist und es, zumindest zu Teilen, als metakommunikatives Produkt 
angesehen werden kann. Hätten wir es mit einem Balkendiagramm zu tun, han- 
delte es sich daher um einen prototypischeren Fall von intermedialer Transkrip- 
tivität. 

Doch auch wenn das Gesprächstranskript als reines Diagramm aufgefasst 
wird, ist dessen Verwendung im vorliegenden Text eine selbstreferentielle, da 
das Diagramm mit der Botschaft „ich bin ein Beispiel für ein linguistisches Dia- 
sramm“ auf sich selbst verweist. 

Verlassen wir aber diesen Spezialfall und wenden uns der üblicheren Praxis 
der Arbeit mit Diagrammen zu. Jäger betont beim symbolischen Medium Sprache 
dessen Eigensinnigkeit. Die in Sprache möglichen rekursiven Transkriptionen 
sind ein wesentliches Verfahren „zur Prozessierung sprachlichen Sinnes“ (Jäger 
2005, 58): 


Dabei handelt es sich um ein eigensinniges Verfahren deshalb, weil die Sprache bei diesem 
semantischen Geschäft auf keine Quellen zurückgreifen kann, die nicht ihrerseits symboli- 
scher Natur sind. [...] Die Fähigkeit nämlich der Sprecher einer natürlichen Sprache, sprach- 
liche Zeichen zu paraphrasieren, zu explizieren und zu erläutern, um auf diese Weise den 
Verwendungssinn von Zeichen transformierend oder affirmierend fortzuschreiben, muss 
als ein für das sprachliche Wissen konstitutives Vermögen angesehen werden, ein Vermö- 
gen, in dem die für sprachliche Zeichensysteme basale transkriptive Logik der Sprache zur 
Erscheinung kommt. (Jäger 2005, 59) 


Worin besteht nun das transkriptive Verfahren des Gesprächstranskripts? Geht 
man vom auditiven Signal aus, haben wir es mit der Verschriftlichung einer inter- 
medialen Transkription zu tun, bei der das auditive Signal in das Medium der 
Schrift in einen Text überführt wird. Wir haben es damit, nach Jäger, mit einem 
Script zu tun, mit dem das Präscript, das auditive Signal, überhaupt lesbar - im 
Sinne von verstehbar — gemacht wird. Doch ist das Gesprächstranskript nicht 
einfach nur ein Text, denn der Text wird mittels eines Sets von diagrammatischen 


13 Nicht von ungefähr bezeichnet man in der Linguistik das Gesprächstranskript als „Tran- 
skript“, da man sich der Umformung der Daten mit der Überführung in Text sehr wohl bewusst 
ist. Trotzdem werden wir sehen, dass ein Gesprächstranskript ein Ergebnis vielfacher Transkrip- 
tionen (im Sinne Jägers) darstellt. Um Verwechslungen zwischen dem linguistischen Analysein- 
strument und dem semiotischen Verfahren nach Jäger vorzubeugen, verwende ich im ersten Fall 
immer die ausgeschriebene Variante „Gesprächstranskript“. 
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Methoden auf eine bestimmte Art und Weise organisiert. Dazu gehört die Zuord- 
nung einzelner Sequenzen zu Individuen, die Segmentierung in Turns mit grafi- 
schen Mitteln, die Codierung prosodischer und nonverbaler Merkmale oder die 
grafische Organisation als Partitur. Ein diagrammatisches Symbolsystem inter- 
agiert also mit dem sprachlichen Symbolsystem - die textuelle Umsetzung der 
gesprochenen Äußerung ist nicht einfach nur eine Legende für das Diagramm, 
sondern konstitutiver Bestandteil. Es ist mehr, als ein diagrammatisch ange- 
hauchter Text, mehr als ein „diagrammatischer Textteil“, wie Steinseifer (2013, 
29) dies beispielsweise für Listen in Texten zeigt. Und der Text ist etwas anderes 
als „nur“ Teil eines Bild-Text-Bezuges, wie sie Stöckl (2004, 274) für wissenschaft- 
lich verwendete Diagramme sieht. Das Gesprächstranskript ist also Ergebnis 
einer weiteren Transkription in ein Diagramm. 

Die Arbeit mit dem Gesprächstranskript ist normalerweise derart, dass die 
spezifische mediale Erscheinung, vor allem die diagrammatischen Aspekte, völlig 
in den Hintergrund treten, die Repräsentation des Gesprächs also im Sinne einer 
„transparent immediacy“ (Bolter/Grusin 2000, 272) als deckungsgleich mit dem 
Repräsentierten, dem Gespräch, aufgefasst wird. (Dies gilt zumindest dann, wenn 
man sehr geübt in der ‚Lektüre‘ ist.) Jäger folgend wird das Medium dabei „trans- 
parent“ (Jäger 2010, 317), es verschwindet - zumindest zeitweise: Denn gleichzei- 
tig ist ihm ein „Störungs-Prinzip“ eingeschrieben, das jederzeit als Störung auf- 
treten kann, bei der das „Zeichen/Medium (operativ) seine Transparenz verliert 
und in seiner Medialität wahrgenommen wird“ (Jäger 2010, 318). Nach Bolter/ 
Grusin (2000, 272) wird damit der Repräsentationsstil „hypermediacy“ aktiv. Bei 
der Arbeit mit einem Gesprächstranskript sind solche Störungen denkbar, wenn 
beispielsweise das Transkript nicht ausreicht, um sich das Gespräch plausibel 
reinszenieren zu können, etwa weil intonatorische Informationen fehlen, um 
eine elliptische Struktur richtig deuten zu können oder ganz banal, weil mit einer 
leeren Klammer „( )“ signalisiert wird, dass dort die Aufzeichnung des auditiven 
Signals unverständlich war. Dann treten die spezifischen Probleme des Mediums 
Gesprächstranskript deutlich zutage. 

In Kapitel 2.2 habe ich festgestellt, dass mit Diagrammen operiert wird. Wie 
verhält sich das im Beispiel des Gesprächstranskripts und was bedeuten derar- 
tige Operationen im Lichte transkriptiver Verfahren? Wie auf einer Karte erlaubt 
das Gesprächstranskript die Orientierung im Gespräch auf zwei Achsen, nämlich 
einerseits auf der gesprächssequenziellen, andererseits der gesprächsorganisa- 
torischen Achse. Erstere gibt die sequenzielle Ordnung wieder, Wort für Wort, 
Turn für Turn, wobei je nach Gesprächstranskript sogar zeitliche Marker über den 
Verlauf codiert sind. Zweitere zeigt die Turn-Abfolgen und ggf. Überlappungen 
verteilt auf die Sprecher/innen. Ich werde in Kapitel 5.2 noch ausführlicher auf 
diese diagrammatische Organisation in Form einer Partiturschreibweise einge- 
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hen — momentan genügt uns diese grobe Skizze, um die grundsätzlichen dia- 
grammatischen Funktionsweisen zu sehen. Dazu gehört also die der leichten Ori- 
entierung in einem Ausschnitt gesprochener Sprache, der normalerweise flüchtig 
und daher schwer analysierbar ist. Darüber hinaus gibt es aber eine Reihe von 
Operationen, um mit dem Diagramm zu arbeiten: 

Eine offensichtliche Operation ist die Selektion und Zitation: Aus einem 
umfangreicheren Gesprächstranskript werden bestimmte Teile für die genauere 
Analyse extrahiert und/oder beispielsweise in einer Publikation zitiert. Damit 
einher geht auch oft eine Verfeinerung oder zumindest Veränderung der Tran- 
skription, indem bestimmte Aspekte für diese Selektion detaillierter oder anders 
transkribiert werden. 

Zentral sind aber Operationen, die durch Transformationen die diagramma- 
tische Darstellung verändern. Die Erstellung eines ersten Gesprächstranskripts 
ist dabei selbstredend der entscheidende erste Schritt, der im Detail aber in viele 
Einzelschritte unterteilt ist, wenn man sich die eigentliche Transkriptionsarbeit 
vor Augen führt. Diese Transkriptionsarbeit ist heute weitgehend softwareunter- 
stützt: Besondere Programme stellen eine diagrammatische Grundstruktur als 
anpassbares Schema zur Verfügung, etwa ein Schema, das Turns auf beliebig 
vielen untereinander angeordneten Ebenen vorsieht, wobei eine Art dynamische 
Eingabemaske bereit steht, in die die Beiträge als Text eingetippt werden können. 
Das Gesprächstranskript entsteht dabei im Zuge vieler Einzelschritte, die sich je 
nach Software und persönlicher Arbeitsmethode stark unterscheiden können, 
aber auf alle Fälle bereits eine Vielzahl von diagrammatischen Operationen ent- 
halten. Dazu zählen beispielsweise das Setzen von Timestamps für die einzelnen 
Beiträge oder die Synchronisation mit den Timestamps der Video- oder Audio- 
aufnahme, die dazu führen, dass algorithmisch unterstützt diagrammatische 
Operationen ausgeführt werden, die die Beiträge in der Fläche anordnen. Wie 
wichtig genau dieser Aspekt der Arbeit mit Software ist, um die wissenschaftli- 
che Analyse generell, diagrammatische Transformationen aber im Besonderen, 
zu verstehen, betont Manovich in seinem Programm der Software Studies (Mano- 
vich 2013).“ Selbst bei Gesprächstranskriptionen, die auf nicht-spezialisierte 
Software wie z. B. ein Textverarbeitungsprogramm zurückgreifen oder aber gänz- 
lich ohne Software, dafür mit Schreibmaschine für ein Typoskript auskommen, 
konstituiert das Medium den Möglichkeitsraum des diagrammatischen Operie- 
rens und begünstigt bestimmte Operationen und Darstellungen. 

Aber selbst, wenn ein Gesprächstranskript vorliegt und damit gearbeitet 
wird, sind weitere diagrammatische Operationen im Spiel. Um diesen Gedanken 


14 Vgl. dazu Kapitel 4 und Abschnitt 4.4. 
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auszuführen, ist es hilfreich, sich nochmals ein wichtiges Ziel der Gesprächstran- 
skription zu vergegenwärtigen: Deppermann (2008, 50) erläutert dieses Ziel bei- 
spielsweise anhand der konversationsanalytischen Prämisse, „daß Gesprächs- 
teilnehmer einander aufzeigen [...], welchen Sinn und welche Bedeutsamkeit sie 
ihren Äußerungen wechselseitig zuschreiben“. Die spezifisch gesprachsanalyti- 
sche diagrammatische Anordnung des Gesprächs - „[w]enn Gespräche sorgfältig 
protokolliert wurden“ (Deppermann 2008, 50) - ermöglicht die Rekonstruktion 
des Gesprächs derart, dass „diese Aufzeigeleistungen den Gesprächsanalytikern 
in der gleichen Weise wie den Gesprächsteilnehmern“ für die Interpretation zur 
Verfügung stehen (Deppermann 2008, 50). Hier klingt das Prinzip einer Art Simu- 
lation des Gesprächs an, ähnlich wie man sich mittels Virtual-Reality-Brille in 
einem virtuellen - simulierten - Raum bewegt, um eine Situation miterleben 
zu können, die man realiter nicht miterleben kann. Aber die Funktion eines 
Gesprächstranskripts geht darüber hinaus, indem sie darauf abzielt, zu abstra- 
hierbaren allgemeinen Befunden über Sprachhandlungen bzw. den Gebrauch 
gesprochener Sprache zu kommen: „Die idiographische Interpretation des Ein- 
zelfalles ist daher nur der Ausgangspunkt für die Rekonstruktion allgemeiner 
Praktiken, Regeln etc., auf denen das Handeln im konkreten Fall beruht.“ (Dep- 
permann 2008, 51). Wichtig ist aber die Rückbindung aller Interpretationen auf 
die sprachliche Oberfläche des Gesprächs, die „Details des interaktiven Gesche- 
hens“ (Deppermann 2008, 51). Ziel ist es, „die Phänomene und Strukturen der 
Gespräche selbst, und zwar direkt und unmittelbar zu erheben und zu dokumen- 
tieren“ (Sager 2001, 1022). Eine weiterführende Interpretation geschieht aber ja 
gerade auch deswegen, weil für die Dokumentation des Gesprächs eine diagram- 
matische Form gefunden worden ist, die eben nicht das Gespräch einfach simu- 
liert, sondern es - in der Terminologie Ludwig Jägers — medial in ein Diagramm 
transkribiert, mit dem operiert werden kann. Damit ist esja gerade nicht das Ziel, 
das Gespräch beispielsweise in einer virtuellen Welt so zu rekonstruieren — oder 
eben: zu simulieren - , dass es im Nachgang miterlebt werden kann, sondern 
der mediale Wechsel, sozusagen die Komplexitätsreduktion in den zweidimen- 
sionalen Raum des Gesprächstranskripts ist genau der Kniff, um einen neuen 
Möglichkeitsraum der Interpretation zu eröffnen. So werden beispielsweise ver- 
schiedene Formen des Sprecher/innenwechsels in der Partiturschreibweise des 
Gesprächstranskripts sichtbar, einfach zählbar, kategorisierbar und vergleichbar. 
Das Erkennen von sich wiederholenden Phänomenen im Gesprächstranskript, 
also von Rekurrenz, ist dabei eine der zentralen diagrammatischen Operationen, 
die dafür notwendig ist. 

Selbst wenn das Gesprächstranskript mit weiteren Daten wie Audio- und 
Videoaufnahmen, Skizzen zur räumlichen Situation etc. angereichert wird, liegt 
die Kraft dieser Dokumentation in ihrer Distanz zum ursprünglichen Gespräch, 
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weil in diesem komplexen Diagrammensemble diagrammatisches Operieren 
möglich wird. 

Diagramme sind also, wie alle Medien, ein transkriptives Verfahren. 

Weiter oben verwies ich auf die von Jäger gemachte Unterscheidung in inter- 
und intramediale Verfahren, wobei er auf die Spezifizität von Sprache verweist, 
die eigensinnig, also selbstreferentiell operiert. Welche Stellung nehmen Dia- 
gramme ein? Sind sie ebenfalls selbstreferentiell? 

Auf den ersten Blick scheint dies nicht der Fall zu sein, denn Diagramme 
transkribieren ein anderes Medium, z.B. Sprachgebrauch, indem sie daraus 
eine Karte, eine statistische Zusammenfassung, ein Gesprächstranskript etc. 
generieren. Allerdings ist die Operationalität von Diagrammen ein Hinweis für 
Selbstreferenz und Eigensinn im Sinne Jägers. Wenn mit einem Diagramm ope- 
riert wird, wird das Diagramm mit diagrammatischen Operationen rekonfigu- 
riert. In ähnlicher Weise geschieht dies, wenn man sprachlich Äußerungen para- 
phrasiert oder zitiert. Durch Operieren mit einem Diagramm werden Schlüsse 
(und Sinn) daraus gezogen, als ob das Diagramm die Daten immer wieder neu 
paraphrasieren würde. Beim Gesprächstranskript sind es die diagrammatisch 
auf eine bestimmte Art und Weise angeordnete Äußerungen, die auf sich selbst 
verweisen, indem durch die Anordnung eine Eigenheit der Relationen zwischen 
diesen Äußerungen sichtbar wird, beispielsweise ein überlappender Sprecher- 
wechsel. Ähnlich ist die diagrammatische Umformung von Fundorten etwa zu 
einer Keyword-in-Context-Liste zu verstehen: Die diagrammatische Anordnung 
offenbart die Relationen zwischen den Belegen. Dabei sind es aber die Textbelege 
selbst, die durch ihre Anordnung auf ihre Relationen zueinander verweisen. Es 
sind diese sehr, wie ich sie nenne, sprachnahen Diagramme, die sich eigensin- 
nig verhalten bzw. durch sich selbst Eigensinn erzeugen. Deswegen nehmen sie 
innerhalb einer Systematik aller Diagramme eine besondere Stellung ein. Auch 
sind aus diesem Grund Diagramme dieses Typs so bedeutend für die Konstitution 
des Untersuchungsgegenstandes in der Linguistik, anders als etwa ein Balken- 
diagramm, das Häufigkeiten aufzeigt, deren Quelle für die Funktionsweise des 
Diagramms grundsätzlich unerheblich ist. 

Solche sprachnahen Diagramme sind zudem bezüglich ihrer Medialität 
besonders transparent. Durch ihre Selbstreferentialität erscheinen sie uns als 
der Untersuchungsgegenstand selbst: Das Gesprächstranskript erscheint als 
das Gespräch, die KWiC-Liste als das Korpus, obwohl es jeweils Diagramme mit 
eigener transkriptiven Logik sind, die dadurch einen eigenen Gegenstand kons- 
tituieren. 
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3.2 Denkstile und Diagramme 


Wie ich im vorherigen Abschnitt im Anschluss an Ludwig Jager beschrieben habe, 
ist dem Diagramm die fortlaufende selbstreferentielle Transkription eingeschrie- 
ben. Daher ist es notwendig, die Praktiken des Umgangs mit Diagrammen zu 
untersuchen, um dessen Bedeutung, beispielsweise in einer wissenschaftlichen 
Disziplin, wie beispielsweise der Linguistik, auf die ich mich hier primar beziehe, 
zu rekonstruieren. Es muss also folgerichtig auch darum gehen, die Gebrauchsbe- 
deutung von Diagrammen zu ergriinden: 


Ein konkretes Bild zu gebrauchen bedeutet, es zeichenhaft in einer sozialen wie kommuni- 
kativen Handlung einzusetzen. Dies impliziert die ebenfalls in Analogie zum Funktionieren 
von Sprache entwickelte Vorstellung von piktorialen Sprechakten [...]. In diesem Sinne und 
in Anlehnung an das Wittgenstein’sche Diktum von den Sprachspielen (auch Zeichenspie- 
len) kann man davon sprechen, dass sich die Bedeutung eines Bildes nur im Gebrauch 
zeigt. (Stöckl 2004, 54) 


Dieses Konzept der Gebrauchsbedeutung lässt sich mit Jan Georg Schneider noch 
weiter denken: Er spricht, ebenfalls in Anlehnung an Wittgenstein von einer 
„Sprachspiel-Linguistik“: 


Dieses Konzept umfasst im Wesentlichen zwei Aspekte: 1. wird eine Sprache vor allem als 
eine Menge von Sprachspielen aufgefasst, ohne dass damit bestritten würde, dass es auch 
so etwas wie Sprachsysteme gibt: Obwohl diese sich ständig verändern, verdienen sie es, 
linguistisch (re-)konstruiert zu werden. 2. wird auch die Linguistik selbst als ein Sprachspiel 
betrachtet; d.h. es wird hervorgehoben, dass die Modellierung des Gegenstands „Sprache“ 
eine konstruktive Praxis ist. (Schneider 2008, 251) 


Genau diese den Gegenstand konstituierende Praxis ist es, die ich aus diagram- 
matischer Perspektive im Blick habe. 

Allerdings beinhaltet bei Diagrammen eine Gebrauchsbedeutung nicht nur 
die Verwendung der Diagramme selbst, sondern auch deren Entstehung. Dies gilt 
insbesondere für Diagramme, die mit dem Computer und mit Hilfe von Algorith- 
men erstellt werden, denn die mit dem Computer möglichen Transformationen 
und deren Beschreibung mittels Programmcode sind Teil der diagrammatischen 
Operationen. 

Im vorherigen Abschnitt diskutierte ich diagrammatische Prozesse als Trans- 
formationen am Beispiel eines Gesprächstranskripts und dessen Gebrauchsbe- 
deutung. Innerhalb der Linguistik ist ein solches Transkript emblematisch für 
eine bestimmte Teildisziplin, nämlich eben die Gesprächslinguistik oder inter- 
aktionale Linguistik. Damit sind bestimmte Forschungsfragen, Prämissen und 
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Methodologien verbunden, also eine bestimmte wissenschaftliche Praxis. In 
diesem Abschnitt möchte ich mich deshalb den folgenden Fragen widmen: 

Inwiefern sind Diagramme Zeugen solcher wissenschaftlichen Praktiken? 
Sind Diagramme ein Mittel, Disziplinen zu konstituieren? Können Diagramme 
— und wenn ja: wie? — als Gegenstände der wissenschaftlichen Disziplinierung 
aufgefasst werden? 

Für einen wissenschaftsgeschichtlichen Blick auf die Praktiken innerhalb 
eines Faches sind die Arbeiten von Ludwik Fleck und dessen Begriffe der Denk- 
stile und Denkkollektive hilfreich. Ausgehend vom 1935 erschienenen Text „Ent- 
stehung und Entwicklung einer wissenschaftlichen Tatsache“ (Fleck 1980) ent- 
wickelt Fleck eine Erkenntnistheorie, die den sozialen und historischen Kontext 
systematisch und als kausale Größe bei der Erzeugung von wissenschaftlichen 
Tatsachen miteinbezieht. Wissenschaft bedeutet demnach nicht das objektive 
Entdecken von Tatsachen. Stattdessen ist man als Wissenschaftlerin oder Wis- 
senschaftler in ein Denkkollektiv eingebunden, in dem ein bestimmter Denkstil 
herrscht, dem man folgt und der die wissenschaftliche Arbeit leitet: 


Es entsteht eine spezifische Bereitschaft, dem Stil entsprechende Gestalten wahrzuneh- 
men, es verschwindet dagegen parallel das Vermögen, nicht stilgemäße Phänomene wahr- 
zunehmen [...]. (Fleck 1983, 107) 


Ein Denkkollektiv ist blind gegenüber Evidenzen, die nicht zum eigenen Denkstil 
passen. 

Ich möchte an dieser Stelle keine ausführliche Einführung in die Erkennt- 
nistheorie von Fleck geben (Fleck 1980, 1983, 2011), sondern in diesem Abschnitt 
einen Aspekt daraufhin prüfen, wie produktiv der Denkstil-Begriff ist, um die 
eingangs erwähnten Fragen zur Rolle von Diagrammen in wissenschaftlichen 
Disziplinen zu fassen. Konkret beziehe ich mich auf die linguistische Diskussion 
zum Fleck’schen Stilbegriff, die nach der Rolle von Sprache als Ausdruck von und 
Beitrag zu einem Denkstil fragt (Andersen et al. 2018b; Fix 2011; Schiewe 1996). 

Ausgangspunkt ist Flecks Erwähnung zweier Mittel, die dazu beitragen, 
einen Denkstil zu prägen: 


Ich möchte nur noch zwei Mittel erwähnen, über die der wissenschaftliche Denkstil verfügt, 
um seinen Produkten den Charakter einer Sache zu verleihen. 

Eines von ihnen sind technische Termini [...]. Das zweite Mittel ist das wissenschaftliche 
Gerät. 


Und er führt weiter aus: 
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Indem wir inmitten von Geräten und Einrichtungen leben, die sich aus dem heutigen wis- 
senschaftlichen Denkstil herleiten, empfangen wir ständig „objektive“ Anstöße, so und 
nicht anders zu denken. Daher rührt die Überzeugung von der vom Menschen unabhängi- 
gen, „sachlichen“ Bedeutung dieses Stils, und die Überzeugung von der „sachlichen“ Natur 
der Erzeugnisse dieses Stils. Das Fernrohr zeigt z. B. den den Saturn umgebenden Ring; ein 
im wissenschaftlichen Denkstil erzogener Mensch begreift nicht mehr, daß man, um den 
Zusammenhang zwischen dem im Fernrohr gesehenen Bild und einem entfernten Planeten 
einzusehen, in diesem Stil denken muß. Mehr noch: Schon allein solche Begriffe des „Pla- 
neten“, des „im Fernrohr gesehenen Bildes“, der „Entfernung“ oder des „Zusammenhangs“ 
beinhalten diesen Stil in sich. In ein Fernrohr zu sehen und in ihm dieses Bild zu sehen 
(und nicht z.B. die Widerspiegelung der eigenen Wimpern) und die Disposition, von dem, 
was man in diesem Rohr sieht, auf das zu schließen, was „am Himmel“ ist, sind bereits 
Elemente des wissenschaftlichen Denkstils. Wer es versteht, in ein Fernrohr zu schauen 
und an den Saturn zu denken, benutzt damit allein bereits einen bestimmten abgegrenzten 
Denkstil (Fleck 1983, 122-123). 


Die Verbindung von Sprache im Sinne von sprachlichen Konzepten und Instru- 
menten sind mit dem Fernrohr-Beispiel offensichtlich gemacht: Sprache auf eine 
bestimmte Art zu verwenden, ist Ausdruck eines bestimmten Denkstils. Doch aus 
linguistischer Sicht stellt sich die Frage, was Sprache hier genau meint (z. B. Kon- 
zepte, Ausdruckweisen, Verwendungsweisen etc.) und ob der linguistische Stil- 
begriff daran anschlussfähig ist. Diese Frage wurde von Ulla Fix diskutiert, die 
Kategorien wie Stil, Text, Wort, Varietät und Metapher als sprachliche Elemente 
eines Denkstils bestimmt, der sich „ja immer sprachlich materialisiert haben 
muss, um wahrnehmbar, beobachtbar zu sein, und weil sich Denken oft (erst) im 
Verlauf der sprachlichen Darstellung entwickelt“ (Fix 2011, 1). In einer erhellen- 
den Kollektivstudie sehen auch Christiane Andersen, Magnus P. Angsal, Walde- 
mar Czachur et al. (2018a) eine fruchtbare Verbindung zur Linguistik, indem sie 
Ausdrucksstil und Denkstil in Zusammenhang bringen. Sie zeigen, dass „Stil als 
Gestaltetheit“ aufgefasst werden muss, „weil jeder kommunikative Ausdruck und 
jedes Handeln, um wahrnehmbar zu sein, eine Form, eine Gestalt haben muss“ 
(Andersen et al. 2018a, 45). Was kommunikativ dargeboten werden soll, nutzt 
einen Ausdrucksstil, aber auch „die Art und Weise, wie wir inhaltlich erfassen, 
wahrnehmen und fokussieren, ist geformt — und in Teilen auch sinnlich wahr- 
nehmbar (Denkstil)“ (Andersen et al. 2018a, 45-46). Die Autor/innen verstehen 
demnach „Ausdrucksstil als sozial sinnhaftes kommunikatives Handeln, Denkstil 
als sozial sinnhaftes epistemisches Handeln“ (Andersen et al. 2018a, 46). 

Die Verwendung von Diagrammen gehört zweifelsohne zum kommunika- 
tiven Handeln und dient der Vermittlung der herrschenden Meinung in einem 
Denkkollektiv. Doch es klang mit Flecks Verweis auf das wissenschaftliche Gerät 
schon an, dass Visualisierung eben nicht nur kommunikatives Handeln, sondern 
auch Teil der wissenschaftlichen Infrastruktur ist, was auch Andersen et al. in 
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ihrer Aufzählung offensichtlich so sehen, indem sie Visualisierungen explizit 
nennen: 


Erkennbar ist der Denkstil in der Gestaltetheit spezifisch genutzter wissenschaftlicher Inf- 
rastruktur durch disziplinär-routinierte Praktiken und deren zeichenbasierte Vermittlung: 
Körper (Forscher/Beobachter und ‚Beforschte‘/Beobachtete), Räume (z.B. Sprachlabor, 
Hörsaal, das ‚Feld‘) und Geräte (z.B. Audiorecorder, Analyse-Software) werden durch 
AkteurInnen/Kollektive (etwa im Kolloquium, Gutachtergremium) in einer Art und Weise 
genutzt, die es ermöglicht, Erkenntnispraktiken (z.B. Fragen, Vergleichen, Klassifizieren, 
Testen usw.) als legitimierte Erkenntnispraktiken, d.h. der vermittelten herrschenden 
Meinung (z. B. gemeinsame Begriffe, Metaphern, Allegorien, Textsorten, Visualisierungen, 
Methoden aus dem Lehrbuch) einer Disziplin gemäß, zu qualifizieren. Insofern verweist der 
Denkstil auf die geteilte Bedeutung der Routinen unter den AkteurInnen wie auch darauf, 
was gemeinsam als Untersuchungsgegenstand und als ‚Tatsache‘ (an)erkannt wird (Ander- 
sen et al. 2018a, 48). 


Visualisierungen sind aber nicht nur Mittel der Erkenntnisdarstellung, sondern, 
beispielsweise ganz deutlich und explizit im Paradigma der Visual Analytics 
(vgl. Abschnitt 2.3.1) ein Instrument, wie es in der Astronomie das Fernrohr oder 
in der Biologie das Mikroskop ist. In der oben zitierten Aufzählung von Infra- 
struktur und Praktiken ist Analyse-Software als Beispiel fiir ein Gerät genannt, 
das beispielsweise im Falle von gesprächsanalytischer Software deutlich einer 
diagrammatischen Grundfigur folgt und dadurch eine spezifische Weise der Dar- 
stellung (z. B. von gesprochener Sprache) erzeugt und damit den Untersuchungs- 
gegenstand auf eine spezifische Weise erzeugt (vgl. zum Zusammenhang von 
Transkriptionsmethoden und Software insbesondere Abschnitt 5.3.2). Aber auch 
explorative Visualisierungstools, wie sie in den Visual Analytics erstellt werden, 
nehmen eine Stellung zwischen kommunikativem und epistemischem Handeln 
ein. Sie werden ja gerade als Instrumente konzipiert und zielen darauf, Wissen 
durch eine systematische Darstellung zu gewinnen. Bei bildgebenden Verfahren 
z.B. in der Medizin sind physisches Instrument (etwa ein Mikroskop oder ein 
Computertomograph) und Methoden der Visualisierung (Einfärbung von Proben 
oder Berechnung eines visuell wahrnehmbaren Bildes eines Körpers aufgrund 
von Absorptionswerten von Röntgenstrahlen) offensichtlich miteinander ver- 
schränkt. Diagramme offenbaren diesen Instrumentencharakter aber generell, 
da mit ihnen eben operiert werden und damit neues Wissen gewonnen werden 
kann. 

Diagramme sind aber immer auch Teil kommunikativer Praktiken, da sie 
selbst Inhalte kommunizieren, aber genau so mit ihnen kommuniziert wird. In 
bestimmten wissenschaftlichen Disziplinen sind sie bei Publikationen absolut 
zwingend, in anderen optional oder gar verpönt. Sie müssen auf eine bestimmte 
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Art und Weise erstellt sein, damit sie dem herrschenden Denkstil des Denkkol- 
lektivs entsprechen. 

In der Gesprächsanalyse etwa wird eine Darstellung gesprochener Sprache 
als einer Schrifttextgrammatik folgender Text nicht akzeptiert. In allem empi- 
risch arbeitenden Wissenschaften wird die Darstellung eines Achsendiagramms 
ohne Hinweise zu den Größen und Einheiten der Achsen als Fehler angesehen. 
Aber beispielsweise darüber, ob metrische Werte auf einer nominalen x-Achse 
als Liniendiagramm visualisiert werden dürfen, die einen Verlauf suggerieren, 
obwohl das die Daten nicht hergeben, herrscht keine Einigkeit über Disziplinen 
hinweg. 

Die Verwendung von Diagrammen in einer Publikation, die dem Denkstil 
entsprechen - oder eben nicht — hat sogar letzten Endes Auswirkungen auf die 
Bewertung und Einordnung der Publikation als professionell — oder eben nicht. 

Fleck hatte als wissenschaftliche Instrumente zwar Objekte wie optische 
Geräte, Maschinen und dergleichen im Blick, doch der Denkstilbegriff kann auch 
den Computer als Instrument integrieren, an dem bemerkenswert ist, dass er 
viele Instrumente sein kann und über kommunikative Praktiken, nämlich Pro- 
grammierung und menschlicher Reaktion darauf, gesteuert wird. In Kapitel 4 
werde ich aber ausführlich auf Diagramme im Umfeld von Computern eingehen 
und mit dem Konzept der Coding Cultures zeigen, wie soziale Bedingungen und 
Praktiken selbst die Programmierung prägen. Wenn man Coding Cultures als eine 
Art von Denkstil und den Computer als diagrammatisch operierendes Metame- 
dium auffasst, dann zerfließen die Grenzen zwischen kommunikativer und epi- 
stemischer Praktik vollends — es wird aber auch deutlich, welches Potenzial das 
diagrammatische Operieren birgt und wie stark alle wissenschaftlichen Arbeiten 
zwischen Softwareprogrammierung und Interpretation von Daten von sozialem 
Handeln durchdrungen ist. 

Zunächst möchte ich aber das Augenmerk nochmals kurz auf den diagram- 
matischen Kanon richten, um die Auswirkungen von Denkstilen auf die diagram- 
matische Praxis zu beleuchten. 


3.3 Kanons und Kulturen 


Wenn in Diagrammen Denkstile sichtbar werden, dann sollten sich folgende 

Hypothesen aufstellen lassen: 

1. In Disziplinen und Subdisziplinen sollte es zu Kanonisierungen bezüglich 
der Diagrammverwendung kommen. Bestimmte Diagramme oder Diagramm- 
arten sind erlaubt oder verpönt, der diagrammatische Handlungsraum ein- 
geschränkt. 
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2. Nina Kalwa (2018) macht darauf aufmerksam, dass auf sprachlicher Ebene 
Denkstile besonders dann explizit werden, wenn es um fachliche Kontro- 
versen geht. Im Normalfall werden denkstilleitende Prämissen, wie in der 
Linguistik etwa eine strukturalistische Theorie, in wissenschaftlichen Texten 
nicht explizit erwähnt sondern stillschweigend als Common Ground voraus- 
gesetzt. Prallen jedoch unterschiedliche Denkstile aufeinander, treten diese 
Prämissen hervor. Analog dazu wäre nun zu erwarten, dass die Diagramm- 
praxis ebenfalls Teil dieses Phänomens ist. Es müssten eine Art „Fahnen- 
diagramme“ (in Anlehnung an Hermanns „Fahnenwörter“, Hermanns 1994) 
geben, die immer dann gezeigt werden, wenn es um grundsätzliche Ausein- 
andersetzungen geht, etwa wenn ein herrschender Denkstil durch eine neue 
Theorie oder Methodologie herausgefordert wird. 

3. Mit neuen Denkstilen innerhalb einer Disziplin ist zu erwarten, dass damit 
auch neue Diagrammtypen einher gehen - sofern Diagramme bei diesem 
Denkstil überhaupt eine Rolle spielen. 

Diese Hypothesen sollen nun im Folgenden diskutiert werden. 


Die Kanonisierung der Diagrammerstellung (1) zeigt sich in zahlreichen Lehrbü- 
chern zu Methodologien und Methoden in Disziplinen und Subdisziplinen, wo 
oft auch eine diagrammatische Praxis gelehrt oder zumindest demonstriert wird, 
insbesondere was Präsentationsgrafiken und teilweise explorative Visualisie- 
rungen betrifft. Beispiele sind z.B. die Gesprächslinguistik mit Anleitungen zur 
Transkription (explorative Visualisierung), die Korpuslinguistik und Textstatistik 
zu statistischen Methoden und dem damit verbundenen Einsatz von Diagram- 
men (Präsentationsgrafiken), die Variationslinguistik mit der Kartenerstellung 
(sowohl für präsentierende als explorative Zwecke) etc. 

Explizite Anleitungen zur Erstellung von Diagrammen sind aber selten, ganz 
im Unterschied zu anderen Disziplinen.” Eher lernt man durch die Visualisie- 
rungspraxis übliche diagrammatische Darstellungen kennen. Dies ist ein Indiz 
dafür, dass in der Linguistik, im Vergleich zu anderen Fächern, Diagramme, ins- 
besondere präsentierende und explorierende, weniger wichtig sind. Ein Gegen- 
beispiel bilden linguistische Teilbereiche, in denen statistische Methoden wichtig 
sind. Dort gehen methodische Darstellung und Visualisierung jedoch Hand in 
Hand. In Stefan Gries‘ „Statistik für Sprachwissenschaftler“ beispielsweise wird 


15 In der Statistik ist die Erstellung von Diagrammen beispielsweise integraler Bestandteil der 
Methodologie, wie beliebige Lehrbücher (z. B. Toutenburg 2000a, 2000b) zeigen. Ein anderes 
Beispiel ist die empirische Sozialforschung, was durch die Anwendung statistischer Methoden 
natürlich naheliegt (vgl. Diekmann 1998 für ein beliebiges Beispiel). 
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R (vgl. Abschnitt 4.4.2) verwendet, um statistische Methoden zu lehren. Damit 
verbunden sind aber mit R produzierbare Diagramme. Die R-Funktionen (insbe- 
sondere der Befehl „plot“) sind aber dergestalt, dass sie Diagramme erstellen, 
die dem empirisch-statistikwissenschaftlichen Denkstil entsprechen, sofern man 
nicht aktiv eingreift. Es ist natürlich auch mit einer solchen Funktion problemlos 
möglich, einen für ein solches Diagramm nicht geeignete Datensatz als Diagramm 
darzustellen, aber die generische Funktion entscheidet aufgrund des Datentyps 
beispielsweise (in Grenzen) selbständig, welcher Diagrammtyp gezeichnet wird. 
Ein bestimmter Denkstil der Visualisierung ist also in die Funktionsweise der Pro- 
grammiersprache und ihrer Funktionen und Bibliotheken eingeschrieben. Dies 
werde ich im Rahmen der „Coding Cultures“ (Abschnitt 4.4) vertiefen. 

Zur Frage nach der Fxistenz von Fahnendiagrammen (2) lassen sich ebenfalls 
Indizien finden. Die Untersuchung der diagrammatischen Praxis in der Reihe Ger- 
manistische Linguistik in Abschnitt 2.4.4 zeigte ja bereits, dass es immer wieder 
zu Zitationen bestehender Diagramme kommt und dabei Spitzenreiter auszuma- 
chen sind - im Fall der untersuchten Daten zählten das Toulminschema (Toulmin 
1958, 101) und Tesniéres Dependenzschema (Tesniére 1953, 14) dazu. 

Die Beobachtungen zu den Fahnendiagrammen hängen dabei mit der 
These zusammen, dass neue Denkstile innerhalb der Disziplin auch zu neuen 
diagrammatischen Formen fiihren (3). Dies hangt aber oft mit der Beriicksich- 
tigung oder gar Erfindung neuer diagrammatischer Grundfiguren zusammen. 
Mit der Gesprachsanalyse oder der Dialektologie lassen sich wiederum Beispiele 
aus der Linguistik heranziehen.'* Ähnlich ist die Übernahme der diagrammati- 
schen Grundfigur Karte für die Dialektologie ein wichtiger Erneuerungsaspekt 
(vgl. Abschnitt 5.2.1). Und bei der Verwendung von Graphen, also Diagramme, 
die Knoten und sie verbindende Linien („Kanten“) enthalten, macht deren Layout 
einen denkstilscheidenden Unterschied: Graphen können „gerichtet“, z.B. in 
Form eines Baumes oder umgekehrten Baumes gelayoutet sein oder aber „unge- 
richtet“ als Netz. Eine Sprachtheorie, die Sprachentwicklung und Sprachfami- 
lien als Baum konzipiert, konstituiert einen anderen Denkstil als eine, die Netze 
verwendet (vgl. Abschnitt 5.5). Und - um ein letztes Beispiel zu nennen - für die 
Korpuslinguistik war in ihrer Anfangszeit und teilweise noch heute die Konkor- 
danz-Liste (KWiC-Liste) emblematisches Fahnendiagramm. 

Die genannten Beobachtungen zum Zusammenhang von Denkstilen und 
Diagrammtypen müssten weiter vertieft werden und sind momentan nicht mehr 


16 Ich werde in Abschnitt 5.3.2 argumentieren, dass durch die Übernahme der diagrammati- 
schen Grundfigur der Partitur für die Transkriptionstechnik überhaupt wichtige Konzepte der 
Gesprächsanalyse wie turn, Sprecherwechsel etc. ‚erfunden‘ werden konnten. 
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als plausible Indizien fiir diesen Zusammenhang. Die Arbeiten zu Denkstilen in 
der linguistischen Wissenschaftsgeschichte von Kalwa (2018) waren dabei die 
Basis, um neben sprachlichen Äußerungen auch Diagramme unter dieser Pers- 
pektive zu betrachten. 


4 Algorithmen und Diagramme 


Es ist evident, dass heute selten wissenschaftliche Diagramme ohne Hilfe des 
Computers erstellt werden. Selbst wenn sie einen „handstiftlichen“ Ursprung 
haben, wie etwa der Kreis in Abbildung 1 ganz zu Beginn dieses Buches, werden 
sie meist digitalisiert und dann in ihrer digitalen Form weiterverarbeitet. Der 
Fokus dieses Kapitels liegt jedoch auf Diagrammen, die aufgrund empirischer 
Daten über ein Set von Anweisungen, also algorithmisch, automatisch erstellt 
werden. Dies ist bereits der Fall, wenn eine Liste von Wertpaaren, z.B. Frequen- 
zen eines Wortes in einem Korpus in verschiedenen Jahren, also eine Zeitreihe, 
mittels geeigneter Software mit einem Klick in ein Balkendiagramm umgeformt 
wird. Ein anderes Beispiel ist die automatische Platzierung von Datensätzen zu 
Aussprachevarianten eines Lexems an bestimmten Erhebungsorten auf einer 
Karte, was zu einer Dialektkarte führt. 

Warum sollen so erstellte Diagramme einen Sonderstatus innehaben? Ist der 
einzige Unterschied zum manuell erstellten Diagramm nicht bloß der Aspekt der 
Quantität? Das maschinell erstellte Balkendiagramm wird exakter sein als das von 
Hand gezeichnete, selbst wenn mit größter Sorgfalt, d. h. auf Millimeterpapier mit 
Lineal und sorgsam gespitztem Bleistift gezeichnet wird. Und es wird schneller 
erstellt sein, besonders dann, wenn nicht nur eine Handvoll Datenpaare, sondern 
Hunderte, Tausende oder Millionen Datensätze zu visualisieren sind. 

Das ist fraglos richtig, doch sind es zwei weitere Aspekte, die eine genauere 
Betrachtung algorithmisch erstellter Diagramme rechtfertigen: 

Schon seit über zehn Jahren wird im Kontext der wissenschaftlichen Visu- 
alisierungen dem Paradigma der „Visual Analytics“ besondere Aufmerksamkeit 
und damit verbundene Hoffnung zuteil. Methoden der Visual Analytics sollen 
dort zum Einsatz kommen, wo die zu analysierenden Daten nicht mehr einfach 
überblickbar sind und deswegen weiter transformiert werden, so dass interaktive 
visuelle Interfaces die Analyse erst ermöglichen: 


Visual analytics is the science of analytical reasoning facilitated by interactive visual inter- 
faces. People use visual analytical tools and techniques to synthesize information and 
derive insights from massive, dynamic, ambiguous, and often conflicting data; detect the 
expected and discover the unexpected; provide timely, defensible, and understandable 
assessments; and communicate assessment effectively for action. (Thomas/Cook 2005, 4) 


Das Zitat nennt die relevanten Merkmale: Große Datenmengen, effiziente 
Analyse, neue Erkenntnisse. Im Zusammenhang mit größer werdenden Daten- 
grundlagen auch in den Geistes- und Sozialwissenschaften und insbesondere 
auch in der Linguistik, etwa in der Form von Textkorpora, wird solchen Methoden 
auch da großen Nutzen zugesprochen. Gerade unter dem Label „Digital Humani- 


8 Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https://doi.org/10.1515/9783110698732-004 
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ties“ erfreut sich Visual Analytics einiger Beliebtheit. Sie sollen, Franco Morettis 
Programm des ,,Distant Readings“ (Moretti 2009) folgend, eine ,,multi-faceted 
view of the textual data“ (Jänicke et al. 2016) ermöglichen. Für die Geschichtswis- 
senschaft konstatiert Richard White: 


visualization and spatial history are not about producing illustrations or maps to commu- 
nicate things that you have discovered by other means. It is a means of doing research; 
it generates questions that might otherwise go unasked, it reveals historical relations that 
might otherwise go unnoticed, and it undermines, or substantiates, stories upon which we 
build our own versions of the past. (White 2010, Hervorh. im Original) 


Eine diagrammatische Aufbereitung der Daten soll also Zugriffe auf Daten erlau- 
ben, die bisher nicht möglich waren, wobei diese neuen Zugriffe nicht nur durch 
die Visualisierung selbst, sondern eben durch die algorithmische Visualisierung 
möglich sein soll. Wenn es also nicht das Diagramm an und für sich ist, was die 
neuen Erkenntnisse ermöglicht (und was nach den Ausführungen in Kapitel 2 zur 
Diagrammatik auch nicht überraschend wäre), muss das Algorithmische genauer 
betrachtet werden - allerdings unter diagrammatischen Gesichtspunkten. 

Diese Reflexionen führen jedoch automatisch zum zweiten Aspekt, warum 
sich ein genauer Blick auf algorithmische Visualisierungen lohnt: Während in den 
Visual Analytics die Visualisierung dort beginnt, wo Daten zu grafischen Formen 
‚gemappt‘ werden, also eine Karte, ein Netzwerk o. 4. maschinell gezeichnet wird, 
ist aus diagrammatischer Sicht fragwürdig, ob diese Visualisierung nicht bloß 
ein kleiner Teilaspekt dessen ist, was das Diagramm ausmacht und viele Schritte 
davor nicht bereits viele wichtige diagrammatische Operationen im Spiel sind. 
Daher wird an dieser Stelle die Frage zentral: Wie verhält sich der Algorithmus 
zum Diagramm? 

Diese Fragen werden im Folgenden angegangen, wobei zunächst die Verda- 
tung von Sprache als Grundlage für alle weiteren Operationen diskutiert werden 
soll. 


4.1 Verdatung von Sprache 


Der Computer ist nicht nur, wie häufig angenommen wird, eine Rechenmaschine, 
sondern ganz grundlegend auch ein textverarbeitendes System. Der Text ist Code, 
der in Schaltzustände übersetzt wird und das Ensemble der Schaltzustände steht 
dann für Werte und Operationen, die wieder zu neuen Schaltzuständen führen, 
die so dargestellt werden, dass sie auch menschlich interpretierbar sind, d.h. 
als Text. Wichtig ist zunächst jedoch der Schritt der Codierung, der nötig ist, um 
Daten und Operationen als Schaltzustände, also digital, zu repräsentieren. 
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Wenn wir nun an die Digitalisierung von sprachlichen Daten denken, ist „Digi- 
talisierung“ ein sehr ungenauer Begriff für diesen Vorgang, was selbstredend an 
den verschiedenen Erscheinungsformen von Sprache liegt: Erscheinungsformen 
sind z.B. gesprochene oder geschriebene Sprache, von sprachlichen Äußerun- 
gen abstrahierte Eigenschaften wie Phoneme, Morpheme, Wörter, syntaktische 
Strukturen etc. Man kann einen Computer mit einer Tabelle von Werten, die von 
Sprachgebrauch abgeleitet sind, füttern oder aber sozusagen mit so genannten 
Rohdaten, also sprachlichen Äußerungen. Diese können, müssen aber nicht 
zwingend, zunächst in ein digitales Format überführt werden, etwa indem ein 
Text digital codiert oder eine Lautäußerung in ein digitales Sprachsignal über- 
führt werden. Dies macht die ursprünglichen Informationen für den Computer 
erreichbar, da sie so codiert und elektronisch repräsentiert sind, um zum Gegen- 
stand von Anweisungen (Programmcode) werden zu können. 

Dies alleine macht den Reiz von Datenanalyse jedoch noch nicht aus, da die 
sprachlichen Äußerungen jetzt zwar digital vorliegen, jedoch noch keine Daten 
sind; sie müssen noch verdatet werden (Bubenhofer/Scharloth 2015). Mit der Ver- 
datung werden weitere Abstraktionsebenen über die digital codierten Informa- 
tionen gelegt, wobei diese mehr oder weniger abstrakt sein können. Bei digital 
codierter geschriebener Sprache gehören linguistische Informationen dazu, etwa 
die Information, wo ein Text beginnt und endet, wo Wort- und Satzgrenzen liegen 
und andere basale Aspekte, die z. B. in der Korpuslinguistik als grundlegende kor- 
puslinguistische Verarbeitungsschritte angesehen werden (Lemnitzer/Zinsmeis- 
ter 2006; Perkuhn et al. 2012). Darauf bauen abstraktere Ebenen auf, die häufig 
sprachliche Einheiten auszählen und Werte aggregieren. Dazu ein Beispiel: 

Zu allen Wörtern (Types) in einem Textkorpus werden Kollokationsprofile 
erstellt, also ausgezählt, welche anderen Wörter typischerweise in ihrer Umge- 
bung auftreten. Um dies zu ermöglichen, wird eine Matrix erstellt, die für jedes 
Wort die Häufigkeiten nennt, mit denen es zusammen mit anderen Wörtern auf- 
tritt. Daraus ergibt sich für jedes Wort eine Reihe von Zahlen, die für die Frequen- 
zen der kollokierenden Wörter stehen. Diese Zahlenreihe ist in gewisser Weise eine 
Art Fingerabdruck des jeweiligen Wortes — es handelt sich um einen Zahlenvektor: 


Tab. 3: Zahlenvektor 


weiß Tür Gefühl essen Garten fahren Zug grün Das 
Haus 1 1 0 0 1 0 0 0 1 1 


Bahnhof 0 1 0 0 0 1 1 0 0 1 
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In diesem erfundenen Beispiel ist das Kollokationsverhalten von „Haus“ durch 
die Zahlenreihe {1, 1, 0, 0, 1, 0, 0, 0, 1, 1} bestimmt. 1 bedeutet, dass das Wort 
„Haus“ mit dem als Spaltentitel genannten Wort zusammen auftritt, 0, dass es 
nicht damit auftritt. „Haus“ - so nehmen wir in diesem erfundenen Beispiel 
an - tritt also zusammen mit „weiß“, „Tür“, „Garten“, „Das“ und dem Punkt auf, 
jedoch nicht mit den anderen Wörtern. Dies drückt der Zahlenvektor aus. Das Kol- 
lokationsverhalten von „Bahnhof“ ist mit {0, 1, 0, 0, 0, 1, 1, 0, 0, 1} bestimmt, es 
tritt zusammen mit „Tür“, „fahren“, „Zug“ und dem Punkt auf. 

So kann die Semantik - wenn man das Kollokationsverhalten in einem geeig- 
neten Korpus als Operationalisierung von Semantik im Sinne einer Gebrauchsbe- 
deutung hinnehmen möchte - mathematisch als Zahlencode, als Vektor, ausge- 
drückt werden. 

Um zu den Vektoren zu gelangen, waren eine Reihe von diagrammatischen 
Operationen nötig, mit denen die Daten umformatiert werden. Auf das obige Bei- 
spiel bezogen, wären dies die Folgenden: In einem Textkorpus werden alle Belege 
für „Haus“ (bzw. für „Bahnhof“) gesucht und aufgelistet. Hier ein Beispiel für 
eine Suche nach „Haus“ in einem Korpus: 


Tab. 4: KWiC-Ansicht 


Das Weiße Haus entschied sich gegen die Reform. 
Das verwunschene Haus besaß weder Tür noch Fenster. 
Sie stand an der Tür des sommerlichen Hauses 
Nur Spießer träumen von Haus und Garten! 
Vor dem Haus lag ein verträumter Garten. 
Der Präsident geht ins Weiße Haus um zu twittern. 


Diese typische „Key Word in Context“ (KWiC)-Ansicht zeigt auf übersichtliche 
Weise die Kontexte des Lemmas „Haus“. Grundlage dieser Ansicht ist ein permu- 
tiertes Register, bei dem ausgehend von einem Korpus jedes Wort (Token) einmal 
als Index für seinen Kontext dient. Das bedeutet, dass der Reihe nach jedes Token 
im Korpus als Index aufgeführt wird, das auf seinen ursprünglichen Kontext im 
Text verweist: 
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Tab. 5: Index (Korpus: Das verwunschene Haus besaß weder Türen noch Fenster.) 


Index (mit Lemma) Kontext 

Das (der|die|das) Das verwunschene Haus besaß 

verwunschene (verwunschen) Das verwunschene Haus besaß weder 

Haus (Haus) Das verwunschene Haus besaß weder Türen 

besaß (besitzen) Das verwunschene Haus besaß weder Türen noch 
weder (weder) verwunschene Haus besaß weder Türen noch Fenster 
Türen (Tür) Haus besaß weder Türen noch Fenster. 

noch (noch) besaß weder Türen noch Fenster. 

Fenster (Fenster) weder Türen noch Fenster. 


Türen noch Fenster. 


Um eine KWiC-Liste zu „Haus“ daraus zu generieren, reicht es, die Zeile mit dem 
Index „Haus“ abzurufen, wofür der permutierte Index idealerweise alphabetisch 
sortiert vorliegt: 


Tab. 6: Index alphabetisch 


Index (mit Lemma) Kontext 


Türen noch Fenster. 


besaß (besitzen) Das verwunschene Haus besaß weder Türen noch 
Das (der|die|das) Das verwunschene Haus besaß 

Fenster (Fenster) weder Türen noch Fenster. 

Haus (Haus) Das verwunschene Haus besaß weder Türen 

noch (noch) besaß weder Türen noch Fenster. 

Türen (Tür) Haus besaß weder Türen noch Fenster. 
verwunschene (verwunschen) Das verwunschene Haus besaß weder 


weder (weder) verwunschene Haus besaß weder Türen noch Fenster 


Wäre das Korpus größer, ergäben sich für „Haus“ entsprechend mehr Zeilen, die 
in die KWiC-Liste übernommen werden könnten. 
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Um nun die Kollokationen von ,,Haus“ zu finden, muss die KWiC-Liste, die aus 
der Suche nach „Haus“ entstanden ist (Tabelle 4) wiederum umgeformt werden, 
etwa in folgender Art: 


Tab. 7: Frequenzindex 


4 1 stand 1 besaß 

2 Tür 1 sommerlichen 1 an 

2 Garten 1 sich 1 geht 

2 Weiße 1 noch 1 um 

2 Das 1 lag 1 zu 

1 ! 1 gegen 1 Vor 

1 weder 1 entschied 1 Der 

1 von 1 ein 1 Spießer 

1 verwunschene 1 die 1 Präsident 

1 vertrdumter 1 des 1 Sie 

1 und 1 der 1 Reform 

1 träumen 1 dem 1 Nur 

1 twittern 1 ins 1 Hauses 
1 Fenster 


Im Prinzip wird also für jedes in der KWiC-Liste vorkommende Wort ein neuer 
Index erstellt, sortiert, die Häufigkeit von Zeilen mit gleichem Index ermittelt 
und rückwärts sortiert nach Häufigkeit ausgegeben. Darin sind nun auch die fünf 
Wortformen enthalten (Punkt, „Tür“, „Garten“, „Weiße“, „Das“), die in der Grund- 
form in der Zahlenreihe (Tabelle 3) vorkommen und dort mit 1 gekennzeichnet 
werden, wobei 1 dafür steht, dass die Kollokation mindestens zweimal vorkommt. 

Das erfundene Beispiel stellt selbstverständlich keine sinnvolle Berechnung 
von Kollokationsprofilen dar; die Vektoren müssten um viele weitere Lemmata 
angereichert werden und sie könnten zudem gewichtet werden, so dass die Häu- 
figkeit der Kollokation im Zahlenvektor berücksichtigt würde, indem dort nicht 
nur die Werte 1 und 0 erlaubt wären, sondern direkt die Häufigkeit angegeben 
würde. 

Es geht mir aber an dieser Stelle darum zu zeigen, welche an und für sich sehr 
einfachen Transformationen von Daten (auflisten, sortieren, auszählen) dazu 
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führen, die Daten in eine komplett andere Form zu bringen. Diagrammatische 
Formen der Darstellung spielen dabei offensichtlich eine entscheidende Rolle: 
Liste, Index, Matrix, Tabelle und weitere mehr. 

Diese Umformungen sind im Prinzip keine komplexen Vorgänge. Würden sie 
jedoch manuell durchgeführt, wären sie bei großen Datenmengen äußerst lang- 
wierig. Dies dokumentieren nicht zuletzt Wörterbuchprojekte, wie etwa eindrück- 
lich anekdotische Schilderungen zum „Thesaurus linguae latinae“ zeigen: 


Die Zettel zu den einzelnen Autoren standen in den Kästen noch so, wie sie nach der Ver- 
zettelung abgeliefert worden waren, also nach Perikopen [Abschnitte, NB] und innerhalb 
dieser in der Wortfolge der Texte. Diese Anordnung mußte noch in die alphabetische umge- 
ändert werden, durch die Spezialwörterverzeichnisse zu den einzelnen Autoren entstanden. 
Diese sehr wichtige Arbeit konnte nur im Büro und in fortlaufender Arbeitszeit ausgeführt 
werden. Dazu waren Feiertage nötig, und so blieben nicht wenige von uns in den letzten 
Universitätsferien, die der Thesaurus an der Georgia Augusta erlebte, nach Ferienbeginn 
noch in Göttingen und ordnete gemeinsam in vielstündigen Arbeitstagen den Wortschatz 
der Texte alphabetisch. Es war keine schwierige, sondern eine ganz vergnügliche Arbeit. 
Das brachte die Gemeinsamkeit und die Aussicht auf raschen und guten Verdienst (für die 
Stunde 1M) mit sich. Wir fanden schnell heraus, wie wir uns in die Hände arbeiten konnten. 
Die großen Tische erleichterten das Auslegen nach Buchstaben und innerhalb dieser nach 
Schriften und Stellen. (Bögel 1996, 16-17) 


Für den Thesaurus wurden seit 1893 eine Sammlung von etwa 10 Mio. Zetteln 
erstellt, um den Wortgebrauch aller aus der Antike bis ins 6. Jahrhundert erhalte- 
nen literarischen und nichtliterarischen lateinischen Texte abbilden zu können.” 
Die Beschreibungen des Arbeitsalltags von Bögel (1996) deuten an, wie für eine 
einfache Sortieraufgabe von Zetteln systematische, raumgreifende Operationen 
nötig waren, „große Tische“, um die Zettel in gewünschter Weise sortieren zu 
können. 

Was heute mit digitalen Daten auf Knopfdruck geschieht, war damals eine 
groß angelegte, organisatorische Aufgabe des manuellen Zettelmanagements, 
die nur mit einer klaren hierarchischen Aufgabenverteilung überhaupt funktio- 
nieren konnte: 


Zu den Kopisten und Lemmatisatoren kamen für die mechanische Material-Verzettelung die 
„Alphabetisatoren“, die Zettel-Ordner. Nun, für diese Arbeit brauchte man noch weniger 
Latein als fürs Abschreiben. (Oskar Hey im Nachwort zu Bögel 1996, 171) 


17 Vgl. TTL > Über den TTL: http://www.thesaurus.badw-muenchen.de/ (letzter Zugriff: 22. Sep- 
tember 2020). 


Verdatung von Sprache — 105 


Der Computer sollte die Möglichkeiten dieser „diagrammatischen Operationen“ 
fundamental ändern, wie bereits die Ausführungen zu den grundlegenden com- 
putertechnischen Operationen zu Beginn des Abschnitts zeigten. Doch zunächst 
tritt zum Ende des Zweiten Weltkriegs Vannevar Bushs „Memex“ auf den Plan 
(vgl. Abbildung 31). Im viel zitierten Artikel „As We May Think“ skizziert Bush, 
Direktor des Büros für „Scientific Research and Development“ der US-Regierung, 
eine Maschine zur Verwaltung der eigenen Bibliothek, die er Memex nennt: 


A memex is a device in which an individual stores all his books, records, and commun- 
cations, and which is mechanized so that it may be consulted with exceeding speed and 
flexibility. It is an enlarged intimate supplement to his memory. (Bush 1945, 121) 


MEMEX in the form of a desk would instantly bring files and material on any subject 


to the operator's fingertips. Slanting translucent viewing screens magnify supermicro- 
film filed by code numbers. At left is a mechanism which automatically photographs 
longhand notes, pictures and letters, then files them in the desk for future reference. 


Abb. 31: Skizze von Bushs ,,Memex“ im Originaltext (Bush 1945, 123) 


Grundlage des Memex sind die Möglichkeiten fotomechanischer Reproduktion 
mit Mikrofilmen. Jede zu speichernde Information wird als Mikrofilm abgelegt 
und über ein mechanisches System indiziert: 


If the user wishes to consult a certain book, he taps its code on the keyboard and the title 
page of the book promptly appears before him projected onto one of this viewing positions. 
[...] Any given book of this library can thus be called up and consulted with far greater facil- 
ity than if it were taken from a shelf. As he has several projection positions, he can leave 
one item in position while he calls up another. He can add marginal notes and comments, 
taking advantage of one possible type of dry photography, and it could even be arranged so 
that he can do this by a stylus scheme, such as is now employed in the telautograph seen 
in railroad waiting rooms, just as though he had a physical page before him. (Bush 1945, 
121-123) 
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Kern der Idee ist also auch hier ein geschickt angeordneter Index, mit dem die 
Mikrofilme aufgerufen und verwaltet werden können. Die auf Mikrofilm gespei- 
cherten Dokumente haben gegenüber den herkömmlichen Archiven auf Papier 
den Vorteil, deutlich kompakter zu sein, da es sich um eine so weit wie möglich 
verkleinerte fotografische Abbildung des Originaldokuments handelt. Es ist des- 
wegen einfacher, diese Mikrofilme platzsparend als Index zu verwalten. Aller- 
dings ist die ganze Funktionalität auch von ebendiesem Index abhängig, denn 
die Auswahl von Dokumenten funktioniert mechanisch und kann nicht direkt auf 
die Inhalte zugreifen, wie wir es etwas bei einer Volltextsuche in digitalen Daten 
gewöhnt sind. Die komplexe Mechanik - „Only a small part of the interior of the 
memex is devoted to storage, the rest to mechanism“ (Bush 1945, 121) — verdeut- 
licht aber den raumgreifenden, diagrammatischen Charakter dieser Operationen, 
nicht unähnlich dem „großen Tisch“ und der Organisation, „sich in die Hände zu 
arbeiten“ der „Alphabetisatoren“ beim Thesaurus Linguae Latinae wenige Jahr- 
zehnte davor. 

Trotz der Limitationen: Der skizzierte Memex erlaubt die mechanische Umord- 
nung der Informationen, alleine schon dadurch, dass die Mikrofilmseiten paral- 
lel über unterschiedliche Projektionen sichtbar gemacht werden. Viel deutlicher 
wird dies aber durch eine weitere Funktion des Memex, nämlich der Erstellung 
von „Trails“. Nach dem Verständnis von Bush sind das „Denkpfade“ durch die 
Daten, also Links, die im Prozess der Interpretation der Daten von der Benutzerin 
oder dem Benutzer angelegt werden. Elektromechanisch werden somit Indizes 
miteinander verknüpft, fotomechanisch gespeichert und somit übertragbar, bei- 
spielsweise zu weiteren Memex-Apparaten. Bush stellt sich in Folge geradezu ein 
neues Berufsbild vor: „There is a new profession of trail blazers, those who find 
delight in the task of establishing useful trails through the enormous mass of the 
common record“ (Bush 1945, 124). 

Bushs Memex wird als Vorläufer des Hypertexts gehandelt (Morris/Tamm 
1993, 173; kritisch dazu Porombka 2001, 27). Die Memex, und später der Hyper- 
text, soll die Befreiung vom klassischen, starren Index ermöglichen und - Bush 
argumentiert hier durch und durch mentalistisch - ein Arbeiten ermöglichen, 
das eher der Funktionsweise des menschlichen Gehirns gleicht, da Dokumente 
durch die „trails“ immer wieder neuartig verknüpft werden können. 

Bush konnte seine Idee des Memex nie umsetzen. Er entwickelte aber Kon- 
zepte für weitere Maschinen, z.B. den „Rapid Selector“, einen Vorläufer des 
Memex, mit dem Dokumente auf Mikrofilm nach Schlüsselwörtern durchsucht 
werden können, indem deren Codes ausgelesen und bei Treffern die Dokumente 
neu abfotografiert und ausgegeben werden. Roberto Busa, Theologe und Lingu- 
ist, der für sein Vorhaben des Index Thomisticus als erster maschinelle Datenver- 
arbeitung zur Erstellung von Konkordanzen und Wortindizes verwendete, testete 
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Bushs Rapid Selector als mégliche Maschine fiir sein Unterfangen. Er formulierte 
dazu: 


Of the systems I have examined up to the present time, two appeared to assure such a 
response: the Rapid Selector and the punched card electrical accounting machines. The 
former operates on microfilm, which carries, beside the photogram of the page, another, 
parallel one, bearing the symbols — coded in combinations of white and black spaces - of 
the words of that page. Before the last war Dr. Vannevar Bush of the Massachusetts Institute 
of Technology outlined this machine but it was completed by Mr. Ralph Shaw, librarian of 
the Department of Agriculture, Washington, where I was able to see it operating already 
in November 1949. Its principal feature is the whirlwind speed with which it explores the 
reels of microfilm - 10,000 photograms per minute — and instantaneously rephotographs 
on another microfilm strip all and only those photograms which bear a determined item. 
[...] I shall not give a detailed description because I thought not suitable to apply this system 
to the composition of concordances; I will only say that, besides not allowing automatic 
printing of the concordances, [...] the rapid selector necessitates on the one hand that all the 
cards, to be made from the sorted microfilm, be of photosensitive paper, and on the other 
hand all the different words and forms of each word be previously coded, for the entire text 
must be translated into numerical symbols by hand. (Busa 1951, 22) 


Busa entschied sich fiir die elektronische Rechenmaschine und die Lochkarten 
(Busa 1951, 22). Uberhaupt konnte sich Bushs Ansatz der mechanischen Daten- 
verarbeitung nicht durchsetzen. Gleichwohl waren die grundsätzlichen Uberle- 
gungen, wie Textdokumente als Daten verwaltet und in neue Zusammenhänge 
gebracht werden können, zwar nicht neu, wenn man beispielsweise an die Wör- 
terbuchprojekte denkt, aber stimulierend. Douglas Engelbart drückte 22 Jahre 
nach Erscheinen von Bushs Artikel in einem Brief dies wie folgt aus: 


I might add that this article of yours has probably influenced me quite basically. I remember 
finding it and avidly reading it in a Red Cross library on the edge of the jungle on Leyte, one 
of the Phillipine [sic] Islands, in the Fall of 1945. (Engelbart 1992) 


Engelbart widmete sich in der Folge der Konzeption und Entwicklung ahnlicher 
Datenverwaltungs-, Interaktions- und Kommunikationssysteme, allerdings auf 
Computerbasis (vgl. Abschnitt 4.2). Der analoge Weg war zu steinig fiir die großen 
Datenmengen, die Arbeiten am Thesaurus Linguae Latinae nahmen weit mehr 
Zeit ein als gedacht und Bushs Rapid Selector war trotz „whirlwind speed“ zu 
kompliziert, um sich durchzusetzen. Die analogen Methoden, Objekte zu ordnen, 
filtern und auszuwählen, waren der Datenflut nicht gewachsen, auch deswegen, 
weil diese Methoden nicht Komplexität reduzierten, sondern erzeugten. Bushs 
Memex sollte benutzt werden, um Trails zu finden. Um diese zu finden und zu 
verwalten, wird ein Trailblazer nötig: 
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Dessen Aufgabe sollte sein, im vernetzten Universum von Informationen aus einer Milliarde 
Bücher gangbare Wege auszuspähen und Verknüpfungen zu legen. Gerade weil die Kon- 
frontation mit der Masse von Informationen durch die Memex nicht beseitigt wird, gerade 
weil der Benutzer mit dieser Masse durch die ungeheure Zentralisierung erst recht konfron- 
tiert wird, muß Bush diesen Berufsstand erfinden, der Orientierungshilfe dort geben soll, 
wo sie fast unmöglich geworden ist. (Porombka 2001, 45-46) 


Bush scheitert, analog-automechanisch ist das nicht machbar, da dafür eine 
Mischung aus digitalen Daten und Hermeneutik notwendig wäre. 


4.2 Computer als Metamedium 


Dass Bush scheiterte und Busa erfolgreich war, lag also darin, dass letzterer den 
Computer benutzte. Bush war zumindest konzeptionell ohne Zweifel nahe dran 
an der Erfindung des Computers und seine Maschine und ihre Funktionsweise 
erinnert in vielen Teilen an die Funktionsweise eines Computers. Doch was ist der 
entscheidende Unterschied zwischen dem Computer und Bushs Memex? 

Pierre Lévy macht in seiner Geschichte des Computers (Lévy 1998) auf den 
Unterschied zwischen der mechanischen Rechenmaschine und dem Computer 
aufmerksam. Oft wird auf Charles Babbage verwiesen, der 1837 eine Beschreibung 
einer Analytical Engine, einer mechanischen allgemeinen Rechenmaschine, ver- 
öffentlichte — eine Maschine, die nie gebaut worden ist, aber funktioniert hätte. 
Levy wendet sich jedoch gegen die Lesart, Babbages Erfindung als Vorläufer des 
Computers zu sehen: 


Man definiert den Computer gewöhnlich als programmierbare elektronische Rechenma- 
schine mit gespeichertem Programm. Dieser letzte Begriff der Programmspeicherung ist 
grundlegend, denn wie wir sehen werden, erhält der Computer erst dadurch seine flexible 
Nutzbarkeit und seinen wahrhaft universalen Charakter. Nun wird die Programmspeiche- 
rung aber erst dann zum technischen Vorteil, wenn eine sehr große Rechengeschwindig- 
keit verfügbar ist, also erst seit dem Auftreten der elektronischen Maschinen. Der Computer 
im eigentlichen Sinne war also für Babbage strikt undenkbar. Einige marginale Passagen 
in den Schriften von Lady Lovelace, der wichtigsten Mitarbeiterin von Babbage, sind als 
Andeutungen der Idee verstanden worden, die Programme der analytischen Maschine zu 
speichern. Doch solange der interne Speicher der Maschine mechanisch, also sehr langsam 
arbeitete, konnte dieser Gedanke nicht denselben Sinn haben wie für uns (Lévy 1998, 910). 


In einer Tabelle vergleicht Lévy (1998, 932) die nötigen Zeiten für mechanische 
Rechenmaschinen im Vergleich zum elektronischen ENIAC, dem ersten rein elek- 
tronischen Universalrechner, um zwei 10-ziffrige Zahlen zu multiplizieren und 
eine Geschoßbahn zu berechnen. Babbages Rechenmaschine hätte 5 Minuten für 
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die Multiplikation und 2,6 Tage für die Geschoßbahn benötigt. Die nachfolgenden 
mechanischen oder elektromechanischen Maschinen konnten diese Werte zwar 
in den Sekunden bzw. Minutenbereich drücken, doch erst die komplett elektroni- 
sche ENIAC schaffte die Aufgaben in einer Millisekunde bzw. 3 Sekunden. Damit 
wird eine andere Dimension von Berechnung erreicht, die Levy als entscheidend 
einstuft. 

Doch neben der Geschwindigkeit ist ein weiterer Aspekt wichtig, mit dem der 
Computer sich von mechanischen Rechenmaschinen unterscheidet: Es ist — das 
klingt bei Lévys Zitat an, seine universelle Programmierbarkeit, die den Compu- 
ter zu einem „Metamedium“ machte (vgl. dazu auch Bubenhofer 2018c). Kay und 
Goldberg (1977) verstehen darunter Folgendes: 


Although digital computers were originally designed to do arithmetic computation, the 
ability to simulate the details of any descriptive model means that the computer, viewed 
as a medium itself, can be all other media if the embedding and viewing methods are suffi- 
ciently well provided. (Kay/Goldberg 1977, 31) 


Die Metamedialität des Computers war nicht einfach so gegeben, sondern ergab 
sich im Verlauf der Geschichte und hängt mit drei Typen des Schreibens mit dem 
Computer zusammen. Till Heilmann reflektiert Schrift und Schreiben im Zusam- 
menhang von Computern und ordnet dieses Feld entlang einer historischen Linie: 


Eine erste, wenn auch grobe, Ordnung mag dann die Betrachtung von Schreibprozessen 
bezogen auf den Computer als Objekt liefern: Offensichtlich kann man erstens, wie bei 
diesem Buch geschehen, über Computer schreiben; zweitens kann man, was für dieses 
Buch ebenfalls gilt, an Computern schreiben; schließlich kann man drittens für Compu- 
ter schreiben - wenn man sie programmiert, bestimmte Operationen auszuführen. Die 
beiden letztgenannten Fälle treten in drei unterschiedlichen Konstellationen auf, welche 
die Geschichte des Computers als Schreibmaschine in drei einander folgende Abschnitte 
gliedern: das Schreiben für Computer (aber nicht an ihnen), das Schreiben für und an Com- 
putern, und das Schreiben an Computern (aber nicht für sie). (Heilmann 2012, 7-8) 


Interessant an Heilmanns Ansatz seiner Mediengeschichte des Computers als 
‚Schreibmaschine‘ im Kontext der vorliegenden Arbeit ist Folgendes: Werden die 
Schreibprozesse mit und am Computer betrachtet, wird deutlich, wie stark der 
Computer von diagrammatischem Operieren geprägt ist. Dies wiederum ist eine 
wichtige Voraussetzung, um genauer zu verstehen, wie die algorithmische Verar- 
beitung von Sprachdaten und die algorithmische Generierung von Diagrammen 
funktioniert. Daher ist der folgende Exkurs in die Computergeschichte und die 
Konzeption des Computers als Metamedium wichtig (ich folge dabei Heilmann 
2012). 
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In den 1940er-Jahren, noch ganz unter dem Eindruck der Tradition mechani- 
scher Rechenmaschinen, wie jene von Babbage oder Bushs Ordnungsmaschine, 
werden Computer als Automaten aufgefasst. Ihnen wird ein Set von Anweisun- 
gen eingeschrieben, um beliebige Eingabewerte abzuarbeiten. Sie wurden etwa 
zur Flugbahnberechnung von Geschossen verwendet; das dafür nötige Regelset 
wurde handschriftlich auf Formblättern notiert und anschließend auf Lochkarten 
übertragen. Die Lochkarten wiederum waren das Eingabeformat für die Rechen- 
maschinen und enthielten die Codes für die nötigen Operationen und zu verwen- 
denden Speicherbereiche. 

Dieser Vorgang ist beschwerlich, deshalb wurden häufig verwendete Anwei- 
sungen innerhalb dieser Regelsets in „Subroutinen“ zusammengefasst. Das war 
der Grundstein für die Entwicklung von Programmiersprachen. Doch bis dahin 
waren die Aufgaben der Formulierung der Regeln, deren Codierung für die 
Eingabe in den Computer und deren Abarbeitung klar voneinander abgegrenzte 
Aufgaben. 

Dies veränderte sich in den 1960er-Jahren entscheidend damit, dass Schreib- 
maschinen oder Fernschreiber an die Computer angeschlossen wurden und 
„interactive computing“ erlaubten. Jetzt war es möglich, Anweisungen live 
während der Ausführung eines Programms abzusetzen und das Programm im 
laufenden Betrieb zu beeinflussen. Nichts anderes tun wir heute, wenn wir mit 
Tastatur, Maus, Bildschirmberührung etc. mit Betriebssystemen und Program- 
men interagieren. Doch der Anschluss der Schreibmaschine an den Computer 
beeinflusste nicht nur den Umgang mit Computern, sondern auch die Bedürf- 
nisse und Möglichkeiten: 


Diese neue Art des Programmierens erforderte selbst passende Programme (sogenannte 
Editoren) und es stellte sich schnell heraus, dass Computer nicht nur zum Schreiben von 
Code taugten, sondern auch dem Verfassen von technischen Berichten, Artikeln und Doku- 
mentationen dienlich sein konnten (Heilmann 2012, 8). 


Mit der PC-Revolution ab den 1970er-Jahren perfektionierte sich das Schreiben 
mit dem Computer und es wurden die dafür nötigen spezialisierten Anwendun- 
gen erstellt, die wir heute in Form von Textverarbeitungsprogrammen kennen. 
Auch Douglas Engelbarts ausgefeiltes System der Text- und Datenverarbeitung, 
auf das ich unten noch zu sprechen komme, gehört dazu. Damit einher gingen 
die Entwicklungen zu grafischen Benutzeroberflächen und zur sogenannten 
WYSIWYG-Darstellung - What you see is what you get -, also der Synchronisie- 
rung von Textdarstellung auf dem Bildschirm und im Druck. 

Text wurde offensichtlicher Gegenstand des Computers. Aber Text war von 
Anbeginn in den Computer eingeschrieben: Er diente schon immer der Verar- 
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beitung von Text in Form von Anweisungen, operierte schriftlich und gab Text 
aus, denn beim Codieren des Computers werden Werte in Form eines Systems 
diskreter Zeichen als Verweise auf Speicherorte „angeschrieben“. Die schriftliche 
Angabe der Zahl 452, codiert auf einer Lochkarte oder in einer höheren Program- 
miersprache als „x = 452“ definiert, ist für den Computer keine Zahl, sondern ein 
Set von Schaltzuständen von Transistoren, also einer elektrischen Repräsenta- 
tion dieser Zuweisung. Der Ausdruck „x=452“ ist semantisch leer und wird rein 
syntaktisch übersetzt in Schaltzustände (Heilmann 2012, 65) und unterscheidet 
sich so nicht grundsätzlich von einer Anweisung wie ,,v = Haus“. Beide Ausdrü- 
cke müssen Schaltzustände auslösen, mit denen, durch weitere Textanweisun- 
gen, operiert wird. 

Ich möchte dieses Operieren als diagrammatisches Operieren auffassen 
(was Heilmann nicht macht): Kalkulieren beim Computer bedeutet schriftliches 
Operieren mit Zeichen, genau so, wie wir als Menschen zum Beispiel schriftlich 
multiplizieren, indem wir auf Papier durch geschicktes, regelhaftes — eben: dia- 
grammatisches - Operieren mittels Schreiben zum Ergebnis kommen (Heilmann 
2012, 42 in Rückführung auf; Kittler 1989; Turing 1936). Damit wird einmal mehr 
deutlich, wie gerade bei der algorithmischen Verarbeitung von Text und der algo- 
rithmischen Erstellung von Diagrammen die Grenze zwischen Diagramm, dia- 
grammatischer Operation und Daten verschwimmt. 

Ein eindrückliches Beispiel des interactive computings und der Textverarbei- 
tung gibt „the mother of all demos“ von Douglas Engelbart im Jahr 1968."? Er und 
sein Team präsentierten dort während 90 Minuten live deren „oN-Line System“ 
(NLS) genanntes System, das alle heute gängigen Funktionen eines modernen 
Betriebsystems und Datenverarbeitungssystems vorwegnahm: Fenstersystem zur 
Ordnung von Inhalten, Hypertext, Navigationssystem, Videokonferenz, kollabo- 
rative Textverarbeitung, Grafik, Revisionskontrolle, Maussteuerung etc.'? Neu 
war auch, das System live zu zeigen — die „Demo“ als Format ist dabei Ausdruck 
der Möglichkeiten des interactive computing — ein Format, das heute bei Soft- 
ware völlig selbstverständlich ist.?° 


18 Die Aufzeichnung ist online verfügbar (SRI International 1968) und basiert auf dem Beitrag 
von Engelbart und English (1968). 

19 Vgl. https://www.dougengelbart.org/content/view/209/448/ (letzter Zugriff: 22.9.2020) für 
weitere Informationen, insbesondere für die Verweise auf die Videoaufnahmen der Demonst- 
ration. 

20 Interessanterweise haben inzwischen Softwaredemonstrationen über Screencast-Videos alle 
anderen Formen von Anleitungen fast komplett ersetzt. Auf Video-Portalen wie YouTube können 
viele Demos zu Software betrachtet werden, was eine Suche nach Software wie „Excel“, „Word 
Formatvorlagen“ o.ä. zeigt. 
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Interessant an Engelbarts Demo sind nicht nur die Inhalte und technischen 
Möglichkeiten des Systems, sondern auch die Demonstration selbst. Sie war 
technisch äußerst aufwändig, insbesondere auch, um die Live-Demonstration 
filmisch festzuhalten, und geprägt durch Douglas Engelbart als Präsentator. Die 
Demo beginnt (nach wenigen einführenden Worten) folgendermaßen: 


Ifin your office, you as an intellectual worker, were supplied with a computer display backed 
up with a computer that was alive for you all day, instantly responsible - RESPONSIVE 
[Lachen] - instantly responsive the reaction you had, how much value could you derive 
from that? Well this basically characterizes what we’ve been pursuing for many years in 
what we call the augmented human intellect research center at stanford research institute. 
Now the whole session is going to be devoted to trying to describe and present to you the 
nature of this program. But unfortunately, or fortunately, the products of this program, the 
technology of it be lend itself well to an interesting way to portrait it to you, so we’re gonna 
try our best to SHOW you rather than TELL you about this program. (SRI International 1968, 
2:20-3:13 meine Transkription) 


Das Programm richtet sich also an, wie Engelbart sie nennt, ,,intellectual worker“, 
also nicht an Programmierer/innen, sondern an Nutzerinnen und Nutzer fiir all- 
tägliche Aufgaben, sei es im beruflichen oder privaten Umfeld. Das Programm ist 
ein Dienst, der „alive“ und „instantly responsive“ ist - Ausdruck des interactive 
computings. Engelbart verweist darauf, dass das System derart gestaltet ist, dass 
es sich anbietet, es zu zeigen, statt zu beschreiben, was eben daran liegt, dass es 
live bedient und universell genutzt werden kann, eben auch zur Demonstration 
seiner Funktionen. 

Hier scheint mir ein feiner, aber wichtiger Unterschied zu anderen Demons- 
trationen von Geräten, die nicht universelle Computer sind, zu liegen: Bei der 
Demonstration eines Autos oder einer Nähmaschine, um zwei beliebige mecha- 
nische Beispiele zu nennen, werden die Funktionen des Fahrens (mit allem was 
dazugehört) und des Nähens (mit allem was dazugehört) gezeigt. Vielleicht wird 
auch auf die Form der Objekte verwiesen. Bei der Demonstration eines universel- 
len Computers hingegen ist gar nicht so klar, was gezeigt wird; es wird ja nicht 
gezeigt, wie man schreiben, rechnen oder zeichnen kann. Es wird gezeigt, wie 
ich beispielsweise schreiben, rechnen oder zeichnen kann. Wenn gezeigt wird, 
dass geschrieben werden kann, steht dieses Zeigen im Dienst der Demonstration 
der universellen Operationsweisen des Computers und nicht der Funktion, Texte 
schreiben zu können. Es muss also die Universalität im Sinne einer Metamediali- 
tät des Computers demonstriert werden — man kann irgendetwas damit machen 
und dabei eben sogar eine Demo, die selbstreferentiell genau diese Funktion hat, 
nämlich sich selbst zu demonstrieren. 
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Engelbart fährt fort und zeigt zunächst die Möglichkeiten der Textverarbeitung, 
wovon unten nur ein kleiner Teil wiedergegeben ist: 


So in my office I have a console like this and there are twelve others that our computer sup- 
plies and we try nowadays to do our daily work on here. So this characterizes a way I could 
sit here and look at a completely blank piece of paper - that’s where I start many projects. 
So with my system that’s a good start. I sit here and say Pd like to load data in. So I’m putting 
in an entity called a statement and that’s full of other entities called words. And if I make 
a mistake I can back up a little bit. So I have a statement with some entities words and do 
some operations on these. I can copy a word. I can say that word like copy after itself. In 
fact that pair of words I like to copy after it selves. I can just do this a few times and get a bit 
of material there. And there are other entities like text. I can say after there I’d like to copy 
from that entity point to that point and copy it. (SRI International 1968, 3:28-4:41, meine 
Transkription) 


Wahrend des Sprechens bedient Engelbart die drei Eingabeinstrumente Tastatur, 
Maus und Befehlstasten und zeigt live, wovon er erzählt. Der Inhalt dieses Teils 
ist das Schreiben, Löschen und Kopieren von Wörtern und Absätzen - also aus 
heutiger Sicht keine weltbewegenden Funktionen (im Gegensatz zu den später 
noch gezeigten Operationen, die selbst aus heutiger Perspektive noch überra- 
schen). Das Operieren mit Text auf einer daten- und programmiertechnischen 
Grundlage wird bei den Ausführungen aber sehr deutlich: es ist von „entities“, 
„statements“ und „operations“ die Rede. Im Vergleich zu einer Schreibmaschine 
sind die Operationsmöglichkeiten hier schon wesentlich vielfältiger, da Textsege- 
mente verändert werden können. Im weiteren Verlauf der Demo zeigt Engelbart, 
wie eine Einkaufsliste erstellt werden kann, die umsortiert, hierarchisiert und gar 
in einen grafischen Vektor konvertiert werden kann, der den zu gehenden Weg 
zu den Geschäften in optimaler Reihenfolge beschreibt (vgl. Abbildung 32, s. u.). 

Im weiteren Verlauf der Demo fallen zahlreiche Begriffe, die Operationen zur 
Text- und Datenmanipulation beschreiben und klassische diagrammatische Ope- 
rationen sind, wie ich sie in den Abschnitten 3.1 und 4.1 bereits vorgestellt habe 
und in Kapitel 5 noch ausführlicher beschreiben werde: „do some operations on 
it“, „constructing views“, „organize, categorize, subcategorize [the list]“, „so we 
have this feature to structure our material“, „make different views [...] modifying 
the structure“ (SRI International 1968). 

Deutlich wird dabei auch, dass die Daten immer wieder in neuen Ansichten 
präsentiert werden und so neue Einsichten ermöglichen. Eine bestimmte Ansicht 
„makes it very nice for studying“ oder die grafische Darstellung des optimalen 
Einkaufsweges aufgrund der Einkaufsliste ermöglicht es, „to see the route Ihave 
to go [...] that’s my plan for getting home tonight“. Und man interagiert mit dem 
System - „just point on it to see“ — und ermöglicht so eine neue Sicht. 
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Abb. 32: Standbilder aus der NLS-Demo von Douglas Engelbart von 1968 (SRI International 
1968) 


Dieses Beispiel zeigt nun die bereits weiter oben von Kay und Goldberg definierte 
Metamedialität des Computers. Sie zeigt sich gerade auch im Format der Demo, 
die sich durch das Zeigen der Metamedialität viel besser dafür eignet als die 
Beschreibung. Wenn man so will ist eben auch die Demo ein durch das Metame- 
dium Computer erzeugtes Medium. 

Die Metamedialität ergibt sich aufgrund der drei Grundfunktionen des Com- 
puters, nämlich der Codierung, Algorithmisierung und Formatierung (Heilmann 
2012, 195), mit denen Daten gespeichert, übertragen und verarbeitet werden. Mit 
der Codierung werden Eingaben in Transistorzustände (und damit ins Digitale) 
übersetzt. Die Algorithmen operieren mit den Eingaben und Daten und durch 
die Formatierung werden die abstrakten Transistorzustände wieder sicht- und 
deutbar gemacht. Keine dieser Repräsentationen ist die „eigentlich richtige“ 
Repräsentation der Transistorzustände; es gibt unendlich viele. Programmcode, 
also Text, sorgt für die Formatierung der Daten und so — handelt es sich bei den 
Daten um Text — gelangen wir zur Erkenntnis, dass damit 
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die Formatierung von Texten eine Sache der Beschreibung von Text durch Text [ist]. Zum 
ersten Mal in der Geschichte des Schreibens bestimmen damit Texte über die ‚Materialität‘ 
der Schrift und nicht umgekehrt die Materialität der Schrift über die Gestalt von Texten 
(Heilmann 2012, 239). 


Traditionell bestimmte also die Materialität von Schrift (auf Papier gedruckt, in 
Holz gekerbt, mit Pinsel und Tusche gemalt etc.) über die Gestalt von Texten. 
Beim Computer ist es anders: Text (als Programmcode) weist an, den Text (textu- 
elle Daten), repräsentiert durch elektronische Schaltzustände, in Schrift (darge- 
stellten Text) zu materialisieren — auf Bildschirmen in verschiedenen Formen, zu 
übertragen, auszudrucken. Was ändert sich damit? 

Es ergibt sich ein riesiges Potenzial an Transformationen von Text in unter- 
schiedliche Formen. Mit Jäger gesprochen (vgl. Abschnitt 3.1) sind also vielfältige 
Transkriptionen möglich, die jeweils auch eine neue Medialität mit sich bringen. 
Dazu kommt, eben durch die Form des interactive computing, ein rekursiver 
Prozess der Textbeeinflussung: Solange der Text nicht ausgedruckt wird, können 
diese Transformationsprozesse, veranlasst durch Text, ständig und live wieder- 
holt werden. Durch Text (als Programmcode) kann veranlasst werden, dass ein 
Text in Textseiten aufgeteilt auf dem Bildschirm ausgegeben und damit Blät- 
tern in einem Dokument simuliert wird; oder aber der Text wird als Frequenz- 
tabelle ausgegeben oder in eine völlig andere Form gebracht. Dahinter stecken 
diagrammatische Operationen, die manchmal auch grafisch als solche sichtbar 
werden, etwa wenn die Frequenztabelle mit Klick sortiert werden kann. Aber das 
ist sozusagen nur die Spitze des Eisbergs, denn alle Transformationsprozesse, 
die ausgelöst werden, und sei es auch „nur“ das Löschen eines Wortes, sind dia- 
srammatische Prozesse, also diagrammatische Transformationen, die auch bei 
Operationen mit grafischen Diagrammen vorkommen können. Dies bedeutet 
eben auch, dass damit diagrammatisches Operieren mehr ist als die Interaktion, 
z.B. über eine grafische Benutzeroberfläche, mit dem grafischen Diagramm als 
Ergebnis einer bestimmten Datenformatierung. Interaktion umfasst alle diagram- 
matischen Operationen, zu denen der Computer fähig ist, also alle algorithmi- 
schen Transformationen und Formatierungen von Daten. Das sind Vorgänge, 
derer sich eine Nutzerin / ein Nutzer, z.B. bei der Arbeit in einer Software zur 
Erzeugung von Diagrammen, kaum bewusst ist. 

Anders ist das etwa bei einer Skizze auf Papier: Zwar kann auf Papier dia- 
grammatisch operiert werden, etwa indem ein geometrischer Beweis geführt 
oder eine Karte gelesen wird, die materiellen Vorbedingungen aber, Papier, Stift, 
können nicht durch den gleichen Operationstyp, also durch Zeichenmanipula- 
tion, verändert werden. Beim Computer hingegen ist die Wahl der Form der Mate- 
rialisierung Teil des Möglichkeitsraums diagrammatischer Operationen, etwa 
indem ich zur Materialisierung einen Bildschirm, einen Papier- oder gar einen 
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3D-Drucker verwende. Insofern kann man alle Operationen mit digitalen Daten 
im Computer als diagrammatische Operationen auffassen. Der Computer wird 
dann zur diagrammatischen Maschine. 

Diagramme sind also nicht bloß „Bilder“, die durch Transformationen von 
Daten entstanden sind, sondern alle damit verbundenen Transformationspro- 
zessein den digitalen Daten selbst haben ebenfalls diagrammatischen Charakter. 

In Abschnitt 4.1 habe ich beschrieben, wie die Zettel eines physischen Zettel- 
kastens für ein Wörterbuch von Hand sortiert werden, indem sie systematisch auf 
einem großen Tisch ausgebreitet werden. Diagrammatische Operationen dieses 
Typus kommen im Computer dauernd vor und können in ständiger Interaktion 
ausgelöst oder völlig neu gestaltet werden, etwa indem ich ein eigenes Script 
schreibe, das die Transformationen auf eine neue Art durchführt. Eine interaktive 
Visualisierung ist erst dann auch in einem diagrammatischen Sinn vollständig 
interaktiv, wenn auch alle Interaktionen mit den Daten möglich sind. Also wenn 
die digitale Verarbeitung und algorithmischen Manipulationen ebenso dazu- 
gehören wie die Beeinflussung der visuellen Darstellung. Das ist der Kern des 
„interactive computing“. 


4.3 Generische Anweisungen 


Der Computer als Metamedium ist natürlich auch in der Lage, Diagramme zu 
zeichnen, das bedeutet, grafisch sichtbar zu machen. In Engelbarts Demo (vgl. 
Abschnitt 4.2) sind dies Diagramme in Form von (hierarchischen) Listen, aber 
auch ein prototypischeres Diagramm, der grafische Vektor, nachdem der Weg zu 
den Geschäften in einer bestimmten Reihenfolge zu gehen ist, um die Einkaufs- 
liste optimal abarbeiten zu können. Die Unterscheidung zwischen Diagramm und 
Nichtdiagramm ist dabei unscharf, was eben am Metamedium Computer liegt, 
mit dem eine elektronisch codierte Information (Transistorzustände) in beliebige 
Ansichten transkribiert werden kann. Denn ob ein Text, den wir im ausgedruck- 
ten Zustand als deutlich weniger diagrammatisch oder gar nicht diagrammatisch 
interpretieren würden, auf dem Computerbildschirm als Text oder Liste mate- 
rialisiert wird, hängt eben von der Formatierung ab. Die elektronisch codierte 
Information kann derart sein - oder kann so algorithmisch bearbeitet werden -, 
dass daraus eine Gliederung formatiert werden kann, etwa in Form von Absätzen. 
Der gleiche Text kann aber auch als Endloszeile ohne Absätze, links- oder rechts- 
bündig, zentriert oder im Blocksatz, als Liste, evtl. sogar hierarchisch gegliedert, 
formatiert werden, je nachdem, welche Informationen elektronisch dazu codiert 
sind. Die diagrammatische Erscheinungsform gibt also nicht den vollen Umfang 
seiner Codierung wieder. 
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Diese Codierung kann sehr unauffällig sein; insbesondere bei Text ist dies der 
Fall, wenn man sich etwa vor Augen führt, dass jedes codierte Zeichen eindeutig 
und diskret als ebendieses Zeichen codiert werden muss, dass ein Leerzeichen 
zwischen Wörtern ebenso ein eindeutig codiertes Zeichen ist (in ASCII z.B. Code 
32, in Unicode U+0020) und nicht einfach Leere, dass ein Absatz ebenfalls mit 
einem diskreten Zeichen codiert ist und deshalb auch genau definiert ist, wie 
viele Leerzeilen zwischen zwei Absätzen vorhanden sind. Bei handschriftlich 
verfasstem Text ist diese Eindeutigkeit auf keiner Ebene in der Form vorhanden. 
Wie groß ein Abstand zwischen zwei Wörtern ist, überhaupt, wo die Wortgrenzen 
liegen und welche Zeichen überhaupt vorhanden sind, muss gedeutet werden 
und es gibt keine Möglichkeit zu eruieren, was die richtige Deutung ist - man 
kann nicht hinter den Text sehen, wie das beim elektronisch gespeicherten Text 
der Fall ist. 

Beim traditionellen Buchdruck hingegen, durch das System der bewegli- 
chen Lettern, liegt eine ähnliche Situation wie beim elektronisch gespeicherten 
Text vor, wobei die Codierung dort eher eine grafische, denn eine logische ist: 
Für die verschiedenen Spatien verschiedener Breite existiert zwar normalerweise 
entsprechendes Blindmaterial, also nicht-druckende Lettern. Um etwa Blocksatz 
zu erzeugen, wird zwischen die Wörter (oder Buchstaben) jedoch nach Bedarf 
beliebig viel Blindmaterial eingefügt, so dass die Information, dass eigentlich nur 
ein Leerzeichen zwischen den Wörtern gemeint ist, verloren geht. Anders beim 
Computer, wo auch bei Blocksatz und einem Anpassen der Spatien zwischen den 
Wörtern die Information „ein Leerzeichen“ erhalten bleibt, für die Formatierung 
aber die Darstellung des Leerzeichens modifiziert wird. 

Beim Computer werden Buchstaben als Zeichen, Wörter, Absätze, Texte etc. 
als Entitäten codiert, so dass eben mit diesen Entitäten operiert werden kann. 
Dies ist natürlich der Gewinn der algorithmischen Bearbeitung und Analyse von 
digitalen Daten mit dem Metamedium Computer und löste alleine auf Textebene 
eine Reihe von neuen Möglichkeiten der Textproduktion und -rezeption aus (vgl. 
dazu ausführlich Lobin 2014, 98-153). 

Aus analytischer Perspektive zielt man nun auf die hinsichtlich einer Methode 
systematische Transformation der Daten, um neue Perspektiven darauf zu gewin- 
nen. Bei Busa (vgl. Abschnitt 4.1) war dies eine technische Herausforderung und 
die gewünschten diagrammatischen Operationen mussten auf einer sehr pro- 
grammiertechnisch nahe Weise abgebildet werden. Je abstrakter die Program- 
miersprache ist, mit der diese Operationen ausgedrückt werden, desto unsicht- 
barer sind die grundlegenden elektronischen Operationen, die dafür nötig sind. 
Bei einer Sortierfunktion muss man sich keinen Sortieralgorithmus überlegen, 
geschweige denn Speicherbereiche reservieren, füllen und darauf zugreifen, 
wie das beim Schreiben von sogenanntem „Maschinencode“, also Hardware- 
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nahem Programmieren der Fall ist.’ Stattdessen muss man höchstens die ent- 
sprechende Funktion aufrufen. Die Medialität der Hardware des Computers wird 
somit — mit Jäger gesprochen (vgl. Abschnitt 3.1) - transparent. Dafür wird das 
enorme Potenzial an möglichen Datentransformationen sichtbar, das dann eben 
genutzt werden kann, um neue Ansichten, also diagrammatische Ansichten, zu 
erzeugen. 

Fragt man nun nach dem Unterschied zwischen Diagrammen, die mit und 
solchen, die ohne Computer erstellt worden sind, scheint zunächst das Vorhan- 
densein eines Algorithmus entscheidend zu sein. Aber was ist ein Algorithmus 
und was sind nicht-algorithmische Diagramme? 

Ein Algorithmus ist ein bestimmtes Regelset zur Lösung eines Problems. 
Dieses Regelset kann schematisch immer wieder auf neue Ausgangsdaten ange- 
wandt werden. Ein Algorithmus ist nicht an einen Computer gebunden, sondern 
kann auch auf nicht-digitale Gegenstände und in nicht-digitaler Form angewandt 
werden. 

Da ein Diagramm ein Schema ist, das immer wieder auf neue Daten hin ange- 
wendet werden kann, sind nicht-algorithmische Diagramme schwer denkbar. 
Worauf die Frage nach dem Unterschied mit und ohne Computern erstellten 
Diagrammen also zielt, ist der Unterschied zwischen einem Diagramm, das über 
Programmcode und einem, das manuell erstellt worden ist. Ob letzteres mit dem 
Computer erstellt worden ist, ist unerheblich: Es kann ein Grafikprogramm o. a. 
eingesetzt werden, um ein Diagramm auf dem Computer zu zeichnen - allerdings 


21 Eine Liste zu sortieren ist für einen Computer keine triviale Angelegenheit. So muss definiert 
werden, nach welchen Kriterien sortiert werden soll: numerisch, alphanumerisch, alphabetisch; 
sodann gibt es unterschiedliche Strategien, zu sortieren: Der Algorithmus kann z. B. darin beste- 
hen, die Liste der zu sortierenden Elemente durchzulaufen und das kleinste Element auszuwäh- 
len und an den Anfang zu stellen. Danach wird die Liste erneut durchlaufen und wiederum das 
kleinste Element ausgewählt und an die zweite Position gestellt, etc. Dieses Verfahren nennt sich 
„Selectionsort“. Oder aber mit der Methode „Quicksort“ wird ein Element ausgewählt, das als 
Vergleichselement dient. Nun wird für jedes Element entschieden, ob es kleiner oder größer als 
das Vergleichselement ist. Kleinere kommen auf die linke, größere auf die rechte Seite. Nun wer- 
den links und rechts des ersten Vergleichselements neue Vergleichselemente ausgewählt und 
wieder wie zuvor verfahren. Dies wird wiederholt, bis es keine neuen Vergleichselemente mehr 
gibt. Es gibt zahlreiche weitere Verfahren, die jeweils Vor- und Nachteile bezüglich Geschwin- 
digkeit und Eignung für große Datenmengen haben (Knuth 1998). Wird ein solcher Algorith- 
mus in einer maschinennahen Programmiersprache implementiert, muss die Verwendung des 
verfügbaren Speichers genau geplant und entschieden werden, wann welche Informationen wo 
gespeichert werden sollen. Bei modernen Programmiersprachen oder gar der Anwendung einer 
Sortierfunktion in einem Programm wie Excel muss man sich nicht mal mehr Gedanken über den 
Sortieralgorithmus machen. 
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so, dass nicht ein generisches Regelset definiert worden ist, dies zu erzeugen, 
sondern indem Linien, Flachen und dergleichen gezeichnet werden. 

Der Unterschied liegt in der Semantisierung der erzeugten grafischen Ele- 
mente: Zeichnet man mit dem Computer ein Balkendiagramm so, dass man z. B. 
in einem Grafikprogramm Flächen mit bestimmten Maßen definiert und darstel- 
len lässt, dann haben diese Flächen für den Betrachter oder die Betrachterin 
wahrscheinlich die Bedeutung, Balken in einem Balkendiagramm zu sein. In der 
elektronischen Codierung jedoch handelt es sich bei den Flächen bloß um das: 
Flächen. Also die Definition der x- und y-Werte von vier Punkten, die ein Rechteck 
ergeben. 

Wenn ein Balkendiagramm mit Programmcode erstellt wird, sind die Flächen 
als Balken des Diagramms codiert. Der Code beinhaltet die Information, dass 
diese Zahlenwerte repräsentieren, dass alle Balken des Diagramms in Relation 
zueinander stehen etc. Die Balken sind also als Entitäten einer größeren Entität, 
einem Diagramm, definiert. 

Bei mit Programmcode erstellten Diagrammen sind die Diagramme Ergeb- 
nis einer ununterbrochenen Kette von Transformationen oder diagrammatischen 
Operationen derselben Art, nämlich der Art, wie sie ein Computer vollziehen 
kann und derart, dass jede Transformation rückgängig gemacht werden könnte, 
um die ganze Genese der Transformationskette zu rekonstruieren. Diese Kette 
wird unterbrochen, wenn man, basierend auf Zahlenwerten, in einer (auch digi- 
talen) Tabelle ein Diagramm manuell zeichnet (egal ob mit Computer oder auf 
Papier) - dann kommt es (mit Jäger) zu einer intermedialen Transkription und 
(mit Bolter/Grusin) einer Remediatisierung (vgl. Abschnitt 3.1). 

Wenn also, wie es in den Visual Analytics z.B. der Fall ist, mit Programm- 
code Diagramme erstellt werden, handelt es sich um eine Folge von intramedi- 
alen (und nicht intermedialen) Transkriptionen mit schematischem Charakter. 
Dies bedeutet auch, dass diese Transkriptionen der medialen Logik folgen - von 
der ersten Transkription auf elektronischer Ebene bis zur Darstellung auf einem 
Bildschirm. 

Diese mediale Logik gilt es im Folgenden nun noch aus einer bestimmten 
Perspektive zu beleuchten, nämlich mit einem kulturellen Zugriff auf die Praxis 
des Programmierens. 


4.4 Coding Cultures 


In der bereits weiter oben erwähnten Studie zur Erfindung des Computers von 
Pierre Levy (1998) wirft der Autor die Frage auf, ob die Geschichte des Computers 
als Technikgeschichte von der mechanischen Maschine zu elektromechanischen 
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und schließlich zur elektronischen, erzählt werden muss. Er verneint diese ver- 
einfachende Sicht: 


War die Entwicklung des Mikroprozessors die eigentliche „Ursache“ für den Erfolg des Per- 
sonal Computers? Nein, sie war nur ein Ereignis unter anderen, das seinen Sinn und seine 
Dynamik erst im Rahmen eines Kampfes gegen die Riesen der Informatikbranche gewann. 
Nennen wir aus dem Sammelsurium der Faktoren, die sich die Gründer der ersten Mikro- 
computer-Firmen zunutze machten: Die Programmiersprache Basic; Schnittstellen, die 
auch von Leuten benutzt werden konnten, die keine professionellen Informatiker waren; 
die Gegenkulturbewegung, die ihren Höhepunkt in den siebziger Jahren in den Vereinigten 
Staaten erreichte; Risikokapital-Gesellschaften auf der Jagd nach raschen Profiten; und so 
weiter. [...] 1976 verband IBM mit dem Mikroprozessor etwas anderes als Apple; es waren 
in der Tat inkompatible „Welten“, das heißt unterschiedliche Netze von Allianzen, in die 
er hier und dort eingebunden war. Dieses Beispiel legt den Gedanken nahe, daß „kausale“ 
Erklärungen [...] in der Geschichte der Technik manchmal ohne Belang sind. Interessanter 
scheint es, hervorzuheben, in welcher Weise die Akteure Situationen, technische Anord- 
nungen und soziale Kräfte zum eigenen Vorteil deuten, „umwidmen“ oder „kapern“ (Lévy 
1998, 919-920). 


Praktiken des Umgangs mit Technik sind also genau so relevant — oder gar rele- 
vanter als technische Entwicklungen, um die Bedeutung computertechnischer 
Verarbeitung zu verstehen. Dies gilt es zu berücksichtigen, wenn die mediale 
Logik des Computers im Hinblick auf diagrammatische Transformationen aus- 
geleuchtet werden soll. Dies möchte ich im Folgenden tun, indem ich die Praxis 
des Programmierens für die Erstellung von Diagrammen in den Blick nehme. Es 
stellt sich dabei beispielsweise die Frage, ob die Wahl einer bestimmten Program- 
miersprache oder Programmierumgebung wie R, Javascript oder Excel einen Ein- 
fluss auf die diagrammatische Praxis hat. Und weiter, ob solche vermeintlich rein 
technischen Entscheidungen bei der Anwendung solcher Diagramme, also der 
Erstellung und Deutung, von Belang ist. 

Ich plädiere dafür, diese kulturellen Entstehungsbedingungen unbedingt 
mitzudenken, wenn man mit Visualisierungen arbeitet, diemit Computern erstellt 
worden sind. Es ist meines Erachtens notwendig, die „Coding Culture“, in deren 
Kontext der Programmiercode entsteht, mitzubedenken. Als Coding Culture ver- 
stehe ich eine Kultur von Praktiken des Programmierens. Solche Coding Cultures 
sind dehalb wichtig, weil die Entscheidung für die eine oder andere Program- 
miersprache, für den einen oder anderen Algorithmus, für die Verwendung dieser 
oder der anderen Funktion primär keine technische Entscheidung ist, sondern 
eine Entscheidung die in Abhängigkeit der Coding Culture steht, in der man sich 
bewegt. 
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4.4.1 Praxis des Programmierens 


Die Software Studies machten bereits vor einigen Jahren auf die kulturelle Ver- 
fasstheit von Software aufmerksam (Fuller 2003; Mackenzie 2006). Software 
spiegelt bestimmte kulturelle Praktiken wider und reproduziert diese gleichzei- 
tig. Grafische Benutzeroberflachen, die „eine ganze Maschine ihren Benutzern 
entziehen“ (Kittler 1993, 233), ermöglichen und verunmöglichen gewisse Prakti- 
ken, noch stärker als es Programmiersprachen tun, die bestimmte Operationen 
zulassen oder eben nicht. Die Art und Weise, wie Daten in Datenbanken reprä- 
sentiert werden, steht in Abhängigkeit kultureller Übereinkünfte zu Wissensre- 
präsentation (Dourish 2014; Manovich 2002). So besteht beispielsweise im Zuge 
von Open-Data-Bewegungen inzwischen (zumindest in Demokratien) mehr oder 
weniger Konsens darüber, dass öffentliche Daten auch öffentlich verfügbar sein 
sollen - und zwar in strukturierter, maschinenlesbarer Form. Die Möglichkeit, die 
Daten in gedruckter Form einsehen zu können, würde dem Ideal der Open-Data- 
Idee nicht genügen. 

Einfach — also meist: frei — verfügbare und handhabbare Software beein- 
flusst die Praxis der wissenschaftlichen Visualisierungen erheblich, wobei dis- 
ziplinäre Unterschiede offensichtlich sind. Während beispielsweise in vielen 
naturwissenschaftlichen Fächern und auch in der Computerlinguistik oder in 
den Digital Humanities die Open-Source-Programmierumgebung „R“ für statisti- 
sche Analysen und Visualisierungen weit verbreitet ist, wird in den Sozialwissen- 
schaften noch stärker das kommerzielle Softwarepaket „SPSS“ verwendet. Und 
in den Geisteswissenschaften, so auch in der Linguistik, kommt eher Excel zum 
Einsatz. Diese Selektionspraxis ist natürlich stetigem Wandel unterworfen und 
bestimmte Gruppen und Denkkollektive innerhalb dieser Disziplinen verwenden 
(in der Tendenz) andere Werkzeuge. 

Ich möchte den Blick aber über Software hinaus lenken und auch Program- 
miersprachen in den Blick nehmen, da anzunehmen ist, dass auch die Imple- 
mentierung von Software in bestimmten Programmiersprachen abhängig von 
Coding Cultures ist und deshalb eine Auswirkung auf die Ergebnisse, also die 
Software, hat. 

Für die kommerzielle Welt sieht der Informatikjournalist Paul Ford (2015) die 
Wahl der Programmiersprache als „the most important signaling behavior that 
a technology company can engage in“ (Ford 2015) und nennt die überspitzten 
Klischees, mit denen unter Programmierer/innen die Sprachen bedacht werden: 


Tell me that you program in Java, and I believe you to be either serious or boring. In Ruby, 
and you are interested in building things quickly. In Clojure, and I think you are smart but 
wonder if you ship. In Python, and I trust you implicitly. In PHP, and we sigh together. In 
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C++ or C, and I nod humbly. In C#, and I smile and assume we have nothing in common. In 
Fortran, and I ask to see your security clearance. These languages contain entire civiliza- 
tions. (Ford 2015) 


Es lassen sich viele solcher Zuschreibungen finden (sie sich natiirlich oft wider- 
sprechen). Der Linguist und Erfinder der Programmiersprache Perl, Larry Wall, 
hielt beispielsweise an der Konferenz „LinuxWorld“ eine bekannte Rede mit dem 
Titel „Perl, the first postmodern computer language“ (Wall 1999), wo er auf zwar 
unterhaltsame, jedoch plausible Weise argumentiert, dass sich Perl gegen vier 
Kulte richte, die die Informatik beherrschten: „spareness“, „originality“, „seri- 
ousness“ und „objectivity“. Perl sei insofern konträr, als dass es Lösungsdogmen 
vermeide und Diversität zulasse: 


Perl programming is unabashedly genre programming. It has conventions. It has culture. 
Perl was the first computer language whose culture was designed for diversity right along 
with the language. (Wall 1999) 


Diese Kulte, die man als Topoi auffassen kann, werden auch von Fuller (2003, 
15) beschrieben, der die ,,idealist tendencies in computing“ beschreibt, mit der 
der Purismus von Zahlen mit Schönheit gleichgesetzt werde. Dieser Topos würde 
zum Dogma des „ästhetischen Programmierens“ führen, das über soziale Kon- 
trolle durchgesetzt wird. „Märchenhafte“ („fabulatory“) Programmieransätze 
wären aber interessanter: 


Numbers do not provide big answers, but rather opportunities to explore further manifold 
and synthetic possibilities-that is to say, they provide access to more figures. (Fuller 2003, 
16) 


Neben dem Purismus-Topos wird auch vom Utilitarismus-Topos gesprochen, der 
die Informatik beherrscht (Goffey 2014, 21), aber auch Technologie generell prägt 
(Böhme 2006, 55; vgl. auch Bubenhofer 2018c). Diese Topoi fließen dann in die 
Programmierung von Software mit ein. 

Im Abschnitt oben (4.3) habe ich argumentiert, dass programmiertechnisch 
erstellte Visualisierungen intramediale Transkriptionen seien, da sie alle auf den- 
selben elektronischen Grundlagen stattfinden. Diese Sicht berücksichtigt jedoch 
noch nicht, wie die Transformationen in formatierter Form erscheinen — auch in 
einem komplexen Zusammenspiel unterschiedlicher Transformationen als Soft- 
ware - und gelesen werden. Aus Sicht der Software Studies merkt auch Andrew 
Goffey an, dass Software mit ihrer eigenen Medialität virtuelle Welten modellie- 
ren würde: 
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Strictly speaking, many of the things that software models are not real-world processes at 
all, they are things that are brought into being by computational technologies themselves. 
(Goffey 2014, 34) 


Goffey bezeichnet dies als „demiurgische Qualität“, als schöpferische Kraft von 
Software, die etwas erzeugt, was vorher nicht existierte (Goffey 2014, 35). Der 
Code aber, der zu Software führt, wird unsichtbar, sobald Software benutzt wird. 
Ihr ist die Praxis der Codeerzeugung nicht mehr anzusehen, insbesondere nicht 
die bunte Mischung verschiedener Codetypen, Tricks und Basteleien - Goffey 
spricht von „Bricolage“: 


clever tricks with assembly language, manipulating the side effects of an algorithm, devis- 
ing workarounds, the smoke and mirrors of user interface design, and so on. The virtu- 
oso smarts of programming practice that get software working can of course eventually be 
explained logically if the code compiles, the app works and users accept it. But in doing so, 
the process disappears into the product and the experimenting, the ‚bricolage‘ gets forgot- 
ten. (Goffey 2014, 35) 


Die Tricks und Bastellösungen während des Programmierens verschwinden also 
im Endprodukt, bei dem nur noch entscheidend ist, ob es funktioniert oder nicht. 
Dies ist natiirlich der Fall, da Software mit der Benutzung eine eigene semioti- 
sche Qualität erhält, mit der nun eben ein Mensch und nicht mehr die Maschine, 
interagiert und ihr seine eigenen Sinnzuschreibungen vornimmt. Damit kehrt die 
„messiness of the world“ (Goffey 2014, 37) zurück - oder, mit Jäger gesprochen, 
es entsteht eine neue Transkription. Trotzdem sind in der Software die Program- 
mierpraktiken, die zu ihrer Erstellung führten, eingeschrieben, aber nicht sicht- 
bar. Es sei denn, ein Programmierfehler tritt auf: Dann wird die Medialität der 
Software für einen kurzen Augenblick als Störung wahrnehmbar. 

Obwohl die Programmierpraktiken nicht mehr sichtbar sind, beeinflussen sie 
jedoch die Form und den Möglichkeitsraum der Operationen sowie den Bedeu- 
tungsraum („software is a semiotic artefact“ Goffey 2014, 36) der Software. Wenn 
man sich mit Computern erstellte wissenschaftliche Visualisierungen generell der 
letzten Jahrzehnte ansieht, dann sind Trends und Moden wie auch disziplinäre 
Eigenheiten sichtbar, obwohl es zu jedem Zeitpunkt immer eine ganze Palette 
von alternativen Erstellungsweisen gegeben hätte. Diese Trends und Moden sind 
eben u.a. ein Ergebnis von unterschiedlichen Programmierpraktiken, die ich 
„Coding Cultures“ nenne. 

Eine sehr umfassende Coding Culture ist das Hacking, das wiederum eine 
Vielzahl weiter unterscheidbarer Coding Cultures umfasst. „Hacking“, verstan- 
den als Tätigkeit, die nicht primär ein konstruktives Ziel erfüllt, sondern dem 
Selbstzweck dient (Levy 2010, 10), ist ein wichtiger Einflussfaktor der Compu- 
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tergeschichte. Ich möchte dieses Thema an dieser Stelle nur kurz streifen (vgl. 
ausführlich Coleman 2012; Levy 2010) und darauf hinweisen, dass Prinzipien 
wie transparenter Code, Open Source, Weitergabe von Code etc., die bei Software 
und der Programmierung in der Wissenschaft eine wichtige Rolle spielen, auf 
die Hackerkultur zurückgehen. Benutzt man also Open Source-Software, sind 
ein Teil dieser Kultur und bestimmte Coding Cultures der Software eingeschrie- 
ben und fließen auch in die Benutzungspraxis mit ein. Dies ist noch stärker der 
Fall, wenn basierend auf solchen Systemen neue Software erstellt wird, wie das 
beispielsweise für die Erstellung von Visualisierungen mit R, Javascript, Perl, 
Python o.ä. der Fall ist. 

Ein Beispiel für die Wirkung der Coding Cultures soll an dieser Stelle R geben: 
Im Web sind zahlreiche Statements zu finden, die sich zur „Philosophie“ dieser 
Programmiersprache äußern, beispielsweise in einem Blogeintrag: 


The visualizations you can create in R are much more sophisticated and much more 
nuanced. And, philosophically, you can tell that the visualization tools in R were created by 
people more interested in good thinking about data than about beautiful presentation. (The 
result, ironically, is amuch more beautiful presentation, IMHO.)” 


Die Begründung für die Benutzung von R geschieht also nicht auf einer techni- 
schen, sondern einer ideologischen Ebene - apostrophiert als „philosophically“. 
Hier ist der Purismus-Topos am Werk, der eine Gleichsetzung von ästhetischem 
Purismus und Denken postuliert. „Gutes Denken“ über Daten würde durch die 
Benutzung von R gefördert und führe zu „schönen“ Visualisierungen, ohne dass 
dies intendiert wäre. Ähnliche Gleichsetzungen finden sich beispielsweise beim 
insbesondere in der Wissenschaft verbreiteten Satzsystem TeX bzw. dem darauf 
basierenden LaTeX, das Textinhalt und Layout konsequent trennt und dafür ver- 
spricht, beim Setzen für ein perfektes Layout zu sorgen.” 

Wenn man nun, als an Programmierphilosophien uninteressierte Forscherin 
oder Forscher, mit R zu arbeiten beginnt, wird man auf der Suche nach Lösungen 
für die unweigerlich auftretenden Probleme im Netz verschiedene Lösungsmög- 
lichkeiten finden. Da diese Lösungsmöglichkeiten oft in Web-Diskussionsforen 
präsentiert werden, existieren dazu meist eine Reihe von Kommentaren, bis hin 
zu ausufernden Diskussionen über das Für und Wider der verschiedenen Lösungs- 
möglichkeiten. Wohlgemerkt: Alle diese Lösungen führen jeweils zum selben 


22 http://www.michaelmilton.net/2010/01/26/when-to-use-excel-when-to-use-r/ (24. 8. 2015) 
23 TeX wurde vom Informatiker Donald E. Knuth aus Unzufriedenheit über die Satzmöglichkei- 
ten für sein mehrbändiges Werk „The Art of Computer Programming“ (der erste Band erschien 
1968 und die Reihe ist noch nicht abgeschlossen; Knuth 2011) selbst entwickelt. 
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4» =| want to conditionally subset a dataframe without referencing the dataframe. For example if | have 
the following: 


long_data_frame_name <- data.frame(x=1:10, y=1:18) 

| want to say: 

subset <- long data_frame_name[x < 5,] 

But instead, | have to say: 

subset <- long _data_frame_name[long_data_frame_name$x < 5,] 


plyr and ggplot handle this so beautifully. Is there any package that makes subsetting a data frame 
similarly beautiful? 


r dataframe subset 


share improve this question asked Nov 1 ‘12 at 15:00 


Ben Haley 
1,909 «1 #10 #16 


3 Thisiswhat subset does. - Matthew Plourde Nov 1'12 at 15:05 
3 Beauty is in the eye of the beholder. :-) You may find with more lovely. — Carl Witthoft Nov 1 12 at 15:07 # 


@Cari | don't see how with would apply in this case. That being said, though, | think it's hard to write 
beautiful R code without using with and within . - Matthew Plourde Nov 1 ‘12 at 15:15 # 


with was made for this. - Roman LuStrik Nov 1 ‘12 at 15:19 


@Roman How so? You'd still have to type the name of the data.frame twice. — Matthew Plourde Nov 1 '12 


at 15:23 


| agree with @mplourde: with with , you would still need subset <- 
with(long_data_frame, long_data_frame_name[x < 5,]) , which doesn't save much (it only becomes 


Abb. 33: Beispiel einer Diskussion auf der Plattform „Stackoverflow“ unter dem Titel „Isthere a 
better syntax for subsetting a data frame in R?“, wobei die Kategorie „Schönheit“ eine zentrale 
Rolle spielt (https: //stackoverflow.com/questions/13179792/is-there-a-better-syntax-for-sub- 
setting-a-data-frame-in-r, 22.9.2020) 


Resultat — lösen also das Problem. Aber sie tun es auf unterschiedliche Weisen, 
wobei offensichtliche Kriterien die Länge des Codes oder die Abhängigkeit oder 
Unabhängigkeit von bestimmten Programmbibliotheken sind. Dabei fallen Argu- 
mente zur Eleganz, Ästhetik oder Sauberkeit der Lösungen und es wird deutlich, 
wie ideologisch geprägt die Diskussion ausfällt. In Abbildung 33 ist eine solche 
Diskussion abgebildet, wo ein Programmierer nach einer „schönen“ Lösung für 
ein Problem sucht, das er aber auf eine „unschöne“ Weise schon gelöst hat. 
Wenn also selbst Lösungswege innerhalb derselben Programmiersprache 
ideologisch diskutiert werden, ist das beim Vergleich verschiedener Program- 
miersprachen oder Softwareplattformen noch ausgeprägter der Fall. So gibt es 
unzählige Diskussionen zur Gegenüberstellung der beiden Scriptssprachen Perl 
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und Python, die beide insbesondere auch zur maschinellen Verarbeitung von 
Sprache (Computerlinguistik, Korpuslinguistik etc.) verwendet werden. Natürlich 
gibt es deutliche technische Unterschiede zwischen den Sprachen. Die folgenden 
Zitate zeigen jedoch, dass auch immer „kulturelle“, „philosophische“ oder ideo- 
logische Gründe genannt (oder unterstellt) werden: 


All languages have their points of strength and weakness except for Perl which is more ofa 
religion than a programming language and has not faults whatsoever :-) 

[...] 

Perl’s major disadvantages are: 

1It is not a trendy newkid on the block. 

(http://www.perlmonks.org/?node_id=102231, 22. 9. 2020) 


Perl’s like vi — you pay up-front, with its golf syntax and scalar vs list DWIM (pronounced 
Dimwit I Am). It’s unix shell on drugs. 
(http://xahlee.info/comp/computer_languages_comparison_perl_python_ruby_javascript 
_php_lisp.html, 22. 9. 2020) 


Perl is better. 

Perl has almost no constraints. It’s philosophy is that there is more than one way to do it 
(TIMTOWTDI, pronounced Tim Toady). 

Python artificially restricts what you can do as a programmer. It’s philosophy is that there 
should be one way to do it. If you don’t agree with Guido’s way of doing it, you’re sh*t out 
of luck. 

Basically, Python is Perl with training wheels. Training wheels are a great thing for a begin- 
ner, but eventually you should outgrow them. Yes, riding without training wheels is less 
safe. You can wreck and make a bloody mess of yourself. But you can also do things that 
you can’t do if you have training wheels. You can go faster and do interesting and useful 
tricks that aren’t possible otherwise. Perl gives you great power, but with great power comes 
great responsibility. 

A big thing that Pythonistas tout as their superiority is that Python forces you to write clean 
code. That’s true, it does... at the point of a gun, sometimes at the detriment of simplic- 
ity or brevity. Perl merely gives you the tools to write clean code (perltidy, perlcritic, use 
strict, /x option for commenting regexes) and gently encourages you to use them. (https:// 
www.quora.com/Which-is-better-Perl-or-Python-Which-one-is-more-robust-How-do- 
they-compare-with-each-other, 22.9.2020) 


Einerseits werden Diskussionen um Computer von Topoi wie Utilitarismus und 
Purismus beherrscht, andererseits hat Programmcode immer eine Bedeutung 
und ist in kulturelle Praktiken eingebettet. Einer Programmiersprache werden 
Absichten unterstellt (sauber oder fantasievoll zu arbeiten) und die damit ent- 
standenen Programme werden als Teil einer Kultur gelesen, die eine bestimmte 
Philosophie widerspiegeln. 
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Kann man sich nun bei der Verwendung von Software oder von Programmier- 
sprachen zur Erstellung von Visualisierungen diesen kulturellen Prägungen, 
diesen Coding Cultures einfach entziehen, indem man sich auf den Standpunkt 
stellt, nur Anwenderin oder Anwender zu sein? Im nächsten Abschnitt möchte 
ich konkret zeigen, welche Auswirkungen Coding Cultures bestimmter Technolo- 
gien, die wichtig für die Erstellung von Visualisierungen sind, haben. 


4.4.2 Excel, R, Javascript, Perl, Python 


Anhand von vier Programmiersprachen und einer Software-Anwendung, die alle 
bei der computertechnischen Bearbeitung und Visualisierung von sprachlichen 
Daten eine bedeutende Rolle spielen, möchte ich die Auswirkungen von Coding 
Cultures auf die Visualisierungen selbst konkretisieren. Zunächst ein paar wenige 
Anmerkungen zu diesen Programmiersprachen bzw. zur Anwendung: 

Excel von Microsoft ist eine bekannte proprietäre und kommerzielle Tabel- 
lenkalkulationssoftware, mit der Daten erfasst, manipuliert aber auch visua- 
lisiert werden können. Die Software gibt es seit 1985, zunächst für das Macin- 
tosh-Betriebssystem, und war innovativ, da es ein grafisches Benutzerinterface 
nutzte. Aus diagrammatischer Sicht bedeutet dies also, dass Excel als eine der 
ersten Softwares die Grundfigur der Tabelle als direkt mit einer Maus manipu- 
lierbare Tabelle anzeigte.”* Neben dem kommerziellen Excel, das ein Teil der 
Office-Suite von Microsoft ist, existiert mit „Calc“ als Teil von „LibreOffice“ oder 
„OpenOffice“? eine Open-Source-Alternative mit ähnlichem Funktionsumfang. 

Rist eine freie Programmiersprache, die insbesondere für statistische Berech- 
nungen (deskriptive und explorative Statistik) und die Erstellung von Diagram- 
men designt wurde.” R existiert seit 1992 und wird laufend weiterentwickelt. Wie 
Javascript, Perl und Python muss auch R nicht kompiliert werden, sondern jeder 
Befehl wird direkt ausgeführt. Rwird grundsätzlich direkt in einer Konsole ausge- 
führt, wobei es verschiedene Oberflächen wie RStudio”’ gibt, die die Verwendung 
von R erleichtern. 

Javascript ist eine Scriptsprache, die hauptsächlich für Webanwendun- 
gen entwickelt worden ist und 1995 von Netscape, dem Unternehmen, das den 
damals populärsten Webbrowser herstellte, in deren Browser eingebaut worden 


24 VisiCalc von 1978 gilt als erstes Tabellenkalkulationsprogramm. 

25 Vgl. https://de.libreoffice.org/ und https://www.openoffice.org/de/ (22. 9. 2020). 
26 Vgl. https: //www.r-project.org/ (22. 9. 2020). 

27 Vgl. https://www.rstudio.com/ (22. 9. 2020). 
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ist. Damit konnten beispielsweise Formulardaten auf Webseiten vor dem Absen- 
den überprüft oder Text und Grafik manipuliert werden. Javascript-Code wird auf 
Seiten des Clients, also des die Webseite aufrufenden Browsers, in einer soge- 
nannten „Sandbox“ ausgeführt, über deren Grenzen hinaus keine Zugriffe etwa 
auf das Dateisystem des Clients möglich sind. 

Perl ist eine von Larry Wall entwickelte Scriptsprache, die 1987 veröffent- 
licht wurde und zunächst die Aufgabe hatte, Informationen aus verstreuten Log- 
Dateien auszulesen. Es ging also darum, Textdateien nach bestimmten Mustern 
zu durchsuchen. Wall, der Linguistik studiert hatte, orientierte sich bei der Ent- 
wicklung von Perl an der menschlichen Sprache, indem z.B. Befehle kontext- 
sensitiv interpretiert werden und es meist verschiedene Ausdrucksmöglichkeiten 
gibt, die zum gleichen Ziel führen. Im Lauf der Zeit entwickelte sich Perl zu einer 
umfassenden Programmiersprache, die vielfältig eingesetzt wird. Lange war Perl 
häufig eingesetzte Sprache, um Text zu verarbeiten, so etwa in der Computerlin- 
guistik.”® 

Python ist ebenfalls eine Scriptsprache, die von Guido van Rossum erfunden 
worden ist und 1991 erstmals publiziert wurde. Ziel war größte Einfachheit und 
Übersichtlichkeit zu erreichen und eine umfangreiche Standardbibliothek von 
häufig benutzten Funktionen anzubieten. Übersichtlichkeit wird etwa dadurch 
erzwungen, dass korrekte Einrückungen der Codezeilen zwingend sind (was bei 
Perl und vielen anderen Sprachen nicht der Fall ist, wo Blöcke mit geschweiften 
Klammern o.ä. markiert werden), was automatisch zu einer gewissen Übersicht- 
lichkeit führt. Gerade in textverarbeitenden Domänen wie der Computerlinguis- 
tik hat Python inzwischen Perl als wichtigste Programmiersprache abgelöst.?? 

Die erwähnten Technologien unterscheiden sich primär natürlich dadurch, 
dass Excel eine Software ist, bei der Programmierung nicht im Vordergrund steht 
(aber in Form von einbettbaren Scripts natürlich möglich ist), bei den anderen 
es sich jedoch um Programmiersprachen handelt, wo erst ein Script geschrie- 
ben werden muss, bevor eine Aufgabe gelöst werden kann. Allerdings ist der 
Unterschied kleiner als er auf den ersten Blick erscheint, da eine Sprache wie R 
beispielsweise oft innerhalb einer Umgebung wie Rstudio benutzt wird, die ein 
grafisches Benutzerinterface anbietet, um etwa Daten durch Menübefehle laden 


28 Vgl. die Erhebung von Tiobe zur Verwendung von Perl: https://www.tiobe.com/tiobe-index/ 
perl/ (letzter Zugriff: 22.9. 2020). 

29 Vgl. die Erhebung von Tiobe zur Verwendung von Python: https://www.tiobe.com/tiobe-in- 
dex/python/ (letzter Zugriff: 22.9. 2020); ferner ist zu beobachten, dass an vielen Instituten für 
Computerlinguistik inzwischen Python gelehrt wird. 
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oder Datensätze grafisch dargestellt betrachten zu können. Bei den Programmier- 
sprachen ist es jedoch so, dass jeder Befehl als Textanweisung einsehbar ist. 

Zudem ist für Python, Perl, R und Javascript der Scripting-Ansatz typisch: 
Traditionell unterscheidet man zwischen Programmiersprachen, die kompiliert 
werden müssen, bevor sie ausgeführt werden können. Damit ist gemeint, dass 
das Programm in Maschinencode transformiert wird, der vom Computer verstan- 
den wird. Dabei entsteht die ausführbare Datei, das Programm, dessen Quellcode 
nicht mehr eingesehen werden kann. Bei sogenannten Scriptsprachen werden 
Befehle einem Interpreter übergeben, der zum Zeitpunkt der Ausführung den 
Code interpretiert und in Maschinencode transformiert. Damit kann das Script, 
oder auch Teile davon, sofort ausgeführt werden. Zudem ist der Quellcode ein- 
sehbar: So kann jede/r Besucher/in einer Website den Javascript-Code, der die 
Funktionen beeinflusst, einsehen. Oder die R-Befehle, die zur Erstellung eines 
Diagramms verwendet worden sind, können veröffentlicht und von anderen 
selbst angewandt werden. 

Scripting-Sprachen entsprechen damit deutlich den Hacker-Prinzipien von 
Open Source, Transparenz und Weitergabe des Quellcodes zur weiteren Verän- 
derung, denn es ist naheliegend (oder im Fall von Javascript gar zwingend), den 
Quellcode bei den selbst erstellten Anwendungen offenzulegen. Somit kann er 
auch von anderen kopiert und für eigene Zwecke angepasst werden. 

Excel entspricht diesen Prinzipien natürlich nicht. Microsoft lebt davon, 
dass die Software gekauft werden muss, nicht verändert und möglichst nicht 
weitergegeben werden kann. Bereits 1976 beklagte sich Bill Gates, der Gründer 
von Microsoft, in einem offenen Brief an die „Computer-Hobbyists“ über „Soft- 
warediebstahl“ durch die zahlreichen Hobby-Computernutzer, die sein Altair 
BASIC nicht gekauft, sondern voneinander kopiert hatten.*° 

R ist bezüglich der Hacking-Philosophie ein Gegenentwurf zu kommerziellen 
Softwarepaketen wie SPSS oder SAS, die proprietären Softwarelösungen für ähn- 
liche Zwecke. Der Quellcode dieser Programme ist nicht offen und die Weiterent- 
wicklung der Software ist in fester Hand der Firmen IBM bzw. SAS Institute. Über 
das Basismodul hinausgehende Funktionen müssen zusätzlich gekauft werden. 
Bei R hingegen gibt es eine Gemeinde von Nutzerinnen und Nutzern, die R weiter- 
entwickelt und um Module mit speziellen Funktionen erweitert. 

Neben den lizenzrechtlichen Aspekten von Open und Closed Source, pro- 
prietärer und freier Software, merkt man den unterschiedlichen Technologien 
aber ihre Einbettung in unterschiedliche Coding Cultures an. Ein Beispiel betrifft 
Javascript: Basierend auf Javascript gibt es für den Bereich der Datenvisualisie- 


30 Vgl. https://en.wikipedia.org/wiki/Open_Letter_to_Hobbyists (22.9. 2020). 
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rung einige Bibliotheken, darunter z.B. „D3“ (Bostock et al. 2011), die auch für 
die in den Kapiteln 6 und 7 gezeigten Visualisierungen verwendet werden. Ein 
anderes Beispiel ist die Bibliothek „P5“?!, die auf der Programmierumgebung 
„Processing“ (Fry 2008) beruht und insbesondere in Design- und Digitalkunst- 
kreisen beliebt ist. Ein Werbevideo für P5 mit der Hauptentwicklerin Lauren 
McCarthy und dem Mitentwickler Dan Shiffman ist symptomatisch für eine 
bestimmte Coding Culture des „just do it“, wie ich es nennen möchte.” Nach einer 
Begrüßung durch McCarthy zeigt Shiffman ein paar P5-Befehle, um interaktive 
Grafiken zu zeichnen. Das Video selbst ist jedoch ebenfalls mit P5 programmiert, 
so dass der Betrachter oder die Betrachterin mit den von Shiffman vorgestellten 
grafischen Elemente (mit den dafür nötigen Codezeilen) direkt interagieren kann. 
Die Demo betont die Einfachheit, mit der programmiert werden kann. Die zu 
Beginn genannten Eigenschaften von P5 sind „Programming for the Arts, Made 
for Teaching, Extensible with Add-Ons, Free to Download, Open Source“. Auch 
am Ende der Demo benennt McCarthy die Zielgruppe von P5, die deutlich macht, 
dass nicht (nur) professionelle Programmierer/innen angesprochen werden, 
sondern auch Programmier-Laien. 


Lauren McCarthy 


K 


Abb. 34: Demo der Javascript-Bibliothek P5 durch Lauren McCarthy und Ben Shiffman (http:// 
hello.p5js.org, 22.9. 2020) 


Typisch für Scriptsprachen sind auch umfangreiche Sammlungen von Code- 
schnipseln und Beispielanwendungen, aus denen man sich den Code für die 
eigene Anwendung zusammenstellen kann. Für D3 etwa, die bereits oben 
erwähnte Javascript-Bibliothek für Datenvisualisierungen, ist auf der Website der 


31 Vgl. https://p5js.org/ (22.9. 2020). 
32 Das Video ist hier einsehbar: http://hello.p5js.org (22. 9. 2020). 
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Bibliothek eine „Gallery“ mit „Visual Index“ von unterschiedlichen Visualisie- 

rungen verfügbar, auf denen man eine eigene Anwendung aufbauen kann.” 

Die Javascript-Bibliotheken, aber auch R, Perl und Python sind Beispiele für 
eine neue Kultur der Software-Entwicklung, die ich wie folgt charakterisieren 
würde: 

-  Praferiert wird Open-Source-Software - der Quellcode liegt offen, d.h. frei 
zugänglich, da und kann einfach weiterverwendet und für neue Applikatio- 
nen angepasst werden. 

- Entprofessionalisierung: Nicht nur Informatiker/innen können anspre- 
chende Anwendungen bauen, sondern auch informatiktechnische Laien. 

-  Experimentierfreudigkeit: Software wird nicht nur nach strikten Bauplanen 
systematisch entwickelt, sondern experimentierend und im positiven Sinn 
eklektisch und erratisch gebaut. 

—  Selbstermächtigung: Die grafischen Benutzeroberflächen vereinfachten zwar 
die Benutzung der Computer, nahmen den Nutzer/innen aber auch immer 
mehr Einflussmöglichkeiten auf das System (vgl. dazu Pratschke 2008). Die 
aktuellen Smartphones und Tablet-Computer in Verbindung mit App-Stores 
sind ein gutes Beispiel: Aufihnen soll konsumiert und nicht Neues geschaffen 
werden, schon gar nicht unter Umgehung der Oberfläche. Durch die Aspekte 
Open-Source, Entprofessionalisierung und Experimentierfreudigkeit ist es 
jedoch wieder einfacher geworden, sich gegenüber dem Computer (und den 
Computerkonzernen) selbst zu ‚ermächtigen‘, also zu programmieren. 


Dies sind Aspekte, für die die Hacking-Kultur schon immer stand und im Zuge 
der breiten Digitalisierung auch in den Geisteswissenschaften und nach einer 
starken Phase der kommerziellen Entwicklung von proprietärer Software nun 
wieder in Mode sind. 

Allerdings: Trotz Experimentierfreudigkeit und Selbstermächtigung führen 
die genannten Technologien auch wiederum zu Kanonisierungsphänomenen, 
was für meinen Untersuchungsgegenstand von besonderem Interesse ist. D3 
etwa ist so erfolgreich und verbreitet, dass diese Bibliothek das Aussehen und die 
Funktionsweisen vieler Datenvisualisierungen bestimmt, da es eben besonders 
einfach ist, bestehenden Code zu verwenden und an die eigenen Daten anzu- 
passen. Es ist immer schneller, dem Kanon entsprechende Visualisierungen zu 
erstellen, als gänzlich neue Wege zu gehen. 

Mit der Wahl bestimmter technologischer Mittel zur Erstellung von Visua- 
lisierungen wird man Teil einer bestimmten Coding Culture. Es gibt die Wahl- 


33 Vgl. https://github.com/d3/d3/wiki/Gallery (22.9. 2020). 
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möglichkeit, sich zu einer bestimmten Coding Culture zu positionieren und sich 
damit auch einer bestimmten Wissenschaftskultur anzuschließen. Das beginnt 
schon damit, dass man sich gegen Ideale der Entprofessionalisierung und Selbst- 
ermächtigung stellen kann, indem man die Visualisierung jemanden übergibt, 
die/der sich professionell damit beschäftigt. Die Visual Analytics als Disziplin 
sind daran interessiert, sich als professionelle Datenvisualisierer/innen und 
damit als Denkkollektiv zu etablieren, indem sie Standards für Visualisierungen 
definieren und Hürden für Außenstehende aufbauen. Ein Beispiel dafür sind die 
Durchführung von wissenschaftlichen Kongressen zu Visualisierungsproblemen, 
bei denen mit dem Reviewverfahren ein Mittel zur Verfügung steht, den Zugang 
zum Denkkollektiv zu regulieren. 

Alternativ kann man sich auf den Standpunkt stellen, die Visualisierung von 
Daten als integralen Teil der gesamten Datenaufbereitung, -Analyse und Inter- 
pretation zu sehen und deswegen eine nicht-professionelle Visualisierung in den 
Händen des eigenen disziplinären Teams vorzunehmen. Je nach Entscheidung 
werden damit auch andere technologische Werkzeuge ausgewählt werden. 


5 Diagrammatische Grundfiguren 


Um die breite Palette an Diagrammen, die in der Linguistik verwendet werden, sys- 
tematisieren zu können, ist es sinnvoll, eine Form von Klassifikation zu benutzen. 
Obwohl es bereits viele Klassifizierungen von Diagrammen gibt, möchte ich im Fol- 
genden eine grundlegende Klassifikation vorschlagen, die insbesondere im Blick 
hat, wie dadurch sprachliche Gegenstände unterschiedlich konstruiert werden. 

Zu bereits bestehenden Klassifikationen zählt etwa die Unterscheidung von 
Bertin (1967), der „les diagrammes“, „les reseaux“ und „la cartographie“ (jeweils 
mit Untergruppen) unterscheidet. Die neuere Einführung von Unwin, Theus und 
Hofmann (2006), die insbesondere die statistischen Visualisierung von großen 
Datenmengen thematisiert, unterscheidet Plots für kategoriale und kontinuierli- 
che Daten, Diagramme für gemischte Skalen, Karten, „Contour Plots and Image 
Maps“, Zeitreihen-Plots, Strukturplots, Diagramme für multivariate kontinuierli- 
che Daten, Netze, Bäume und weitere mehr. Sehr praxisorientierte Klassifikationen 
im Kontext deskriptiver Statistik unterscheiden Säulen-, Kreis-, Linien- und Streu- 
diagramme (Sauerbier 2009), die wiederum als Achsendiagramme zusammen- 
gefasst und um Graphen, Mengendiagramme und figürliche oder kartografische 
Darstellungen (so beispielsweise die Wikipedia zu „Diagramm“ ?*) ergänzt werden. 

Mit linguistischem Hintergrund ist die Arbeit von Ann Harleman Stewart 
(1976) erwähnenswert, die sich allerdings auf eine Analyse grafischer Reprä- 
sentationen von Modellen linguistischer Theorien beschränkt. Sie unterscheidet 
darin Baumdiagramme, Matrizen und Kastendiagramme („Box diagrams“). 

Mit dem aktuellen Visualisierungsboom nimmt die Palette an vorgeschla- 
genen Visualisierungen jedoch enorm zu und erschwert die Klassifikation. 
Symptomatisch ist vielleicht die „Gallery“ der D3.js-Bibliothek, in der 347 ver- 
schiedene Diagrammtypen gezeigt werden, wobei die Benennungen generisch 
beginnen („Box Plots“, „Bubble Charts“, „Chord Diagram“, „Dendrogram“ etc.), 
aber immer spezifischer werden („Interactive Multi-Metric Bars“, „Hexagonal 
Binning“ oder „Draggable Scatterplot with Motion Trails“). Die Klassifikation 
hängt dabei natürlich vom damit verbundenen Zweck ab; eine „Gallery“ z.B. 
zielt nicht auf eine erschöpfende, monohierarchische Systematik. Im Kontext 
der Statistik beruhen die Klassifikationen zudem deutlich auf den Datentypen, 
insbesondere dem Skalenniveau (nominal, ordinal, kardinal). Bei der Fülle der 
Diagrammtypen ist zudem eine multiperspektivische Klassifikation sinnvoll, wie 
sie etwa Kucher und Kerren (2015) für Textvisualisierungstechniken vorschlagen: 


34 Vgl. https://de.wikipedia.org/wiki/Diagramm (letzter Zugriff: 22. 9. 2020). 
35 Vgl. https://github.com/d3/d3/wiki/Gallery (letzter Zugriff: 22.9. 2020). 
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Ihre Sammlung von 400 Techniken klassifizierten sie unter Gesichtspunkten wie 
Typ der analytischen Aufgabe (wie Themenanalyse, Bewertung, Trendanalyse 
etc.), Visualisierungsaufgabe (Vergleich, Überblick, Clustering etc.), Dateneigen- 
schaften und Domäne.?® 

Mir geht es nun aber darum, mit einem diagrammatischen Blick die Visuali- 
sierungspraxis in der Linguistik zu betrachten. Ich schlage dafür fünf diagramma- 
tische Grundfiguren vor, die für die Darstellung von Sprache besonders wichtig 
sind, weil sie sprachliche Daten aufje unterschiedliche Art transformieren und so 
je unterschiedliche Untersuchungsgegenstände konstruieren: Listen, Partituren, 
Karten, Vektoren, Graphen. Sie transformieren Sprachdaten derart fundamen- 
tal, dass sie nicht einfach eine Visualisierungsmethode für die ursprünglichen 
Daten sind, sondern die Entscheidung für eine der diagrammatischen Grundfi- 
guren greift grundlegend in Eigenschaften von sprachlichen Erscheinungsfor- 
men wie Sequenzialität, Materialität oder Kontextualisierung ein. Sie sind zu 
vergleichen mit den von John Unsworth (2000) vorgeschlagenen „Scholarly Pri- 
mitives“, grundlegenden geisteswissenschaftlichen Tätigkeiten. Unsworth zählt 
dazu: Discovering, Annotating, Comparing, Referring, Sampling, Illustrating und 
Representing. Während Unsworth diese als Ausgangspunkt nimmt, um Software 
für die Digital Humanities zu skizzieren, beschreiben sie grundsätzliche Heran- 
gehensweisen an Text, die durch algorithmisch-quantitative Methoden mit digi- 
talem Material neu akzentuiert werden. 

Die Verwendungspraxis der diagrammatischen Grundfiguren steht in Wech- 
selwirkung mit kulturellen, gesellschaftlichen, wissenssoziologischen und tech- 
nologischen Entwicklungen. Ich möchte deshalb mit den jeweiligen Grundfi- 
guren auch zeigen, wie sie eine neue Sicht auf Sprache und neue linguistische 
Fragestellungen ermöglichen. Zusätzlich sind die Wechselwirkungen mit Coding 
Cultures zu thematisieren, um die technologischen Aspekte der Visualisierung 
nicht einfach als zwar notwendige, aber utilitaristisch geprägte, kühle und damit 
uninteressante Entscheidung abzutun, sondern - im Gegenteil — die Verwo- 
benheit von Analyse, Interpretation, technischer Implementierung und wissen- 
schaftskultureller Einbettung im Bezug auf ihre Funktion zu sehen. 


5.1 Listen 


Die diagrammatische Grundfigur der Liste begegnet uns formal als geordnete 
und ungeordnete, flache und hierarchische sowie geschlossene und offene 


36 Vgl. http://textvis.Inu.se (letzter Zugriff: 22. 9.2020). 
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Listen, aber auch als Tabellen, die eine spezifische Art hierarchischer Listen sind. 
Listen behaupten eine Ähnlichkeit der darin enthaltenen Elemente, können aber 
zusätzlich durch eine Ordnung oder Hierarchisierung diese Ähnlichkeit wiede- 
rum innerhalb der Sammlung differenzieren und gliedern. Diese Leistungen und 
Eigenschaften gelten für Listen ganz generell und sind nicht spezifisch für die 
Linguistik (Eco 2009; Jullien et al. 2004; Echterhölter 2015). 

Wenn es aber um sprachliche Daten geht, dann stechen zwei Formen der 
Liste besonders hervor: 
— die Liste als Index, 
—  lexikalische Listen. 


Nattirlich sind Listen selbst ein textstrukurierendes Element mit diagrammati- 
schem Charakter (vgl. dazu Steinseifer 2013), wie meine gerade verwendete, 
eigene Liste oben zeigt. Jede aus analytischer Sicht erzeugte Liste findet selbst 
im Medium von Text statt, ist jedoch im Normalfall von transparenter Medialitat 
(nach Ludwig Jäger, vgl. Kapitel 3.1) und fällt nur im ‚Störungsfall‘ auf, etwa beim 
Redigieren und Formatieren eines Textes. 

Lexikalische Listen verweisen auf die lange Tradition von Wörterbüchern und 
Enzyklopädien, zurückgehend auf Glossen. Wörterbücher (und ähnliche Listen) 
sind ein Ergebnis von Lektüre relevanter Texte. Anhand der Geschichte deutsch- 
sprachiger Wörterbücher in mittelalterlichen Klöstern lässt sich dies gut zeigen: 
Die Erstellung von Glossen am Textrand, zwischen den Zeilen oder dann eben auf 
einem separaten Pergament bei der Lektüre, etwa der Bibel, stand am Anfang der 
Wörterbuchgeschichte. Die Glossierung ergab sich aus dem Bedürfnis, wichtige 
Termini im lateinischen Text in die eigene Muttersprache zu übersetzen (Haß- 
Zumkehr 2012, 41). Der „Abrogans“ gilt als älteste deutschsprachige Glossen- 
sammlung mit Wörterbuchcharakter, das auf einem lateinischen Synonymver- 
zeichnis beruht und zu den lateinischen Termini allemannische Übersetzungen 
aufführt (die St. Galler Stiftsbibliothek verwahrt eine der vier noch erhaltenen 
Abschriften; Gennadius 775). Abbildung 35 zeigt eine Seite aus dem Cod. Sang. 
911 - und zeigt auch, dass die Glossensammlung nicht einer prototypischen Vor- 
stellung von Liste folgt, sondern die Einträge der Liste ohne erzwungenen Zeilen- 
umbruch abgegrenzt sind, die Abgrenzung aber über farbliche Markierungen der 
Anfangsbuchstaben erfolgt. Bei den anderen drei Abschriften (Karlsruhe Cod. 
Aug. CXI, Paris Ms. Lat. 7640, Prag Cod. XXIII.E.54) ist die Glossensammlung 
allerdings als umbrochene Liste realisiert.” 


37 Vgl. http://www.handschriftencensus.de/werke/728 (letzter Zugriff: 22.9. 2020). 
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Abb. 35: Codex Abrogans, St. Gallen, Stiftsbibliothek, Cod. Sang. 911, p. 4 - Abrogans - 
Vocabularius (Keronis) et Alia; erste Seite des Wörterbuches 


Die erste Seite der Glossensammlung wird mit ,,incipiunt closas ex uetere testa- 
mento“ eingeführt; der erste Eintrag ist das namensgebende Lemma „Abrogans“ 
gefolgt von den Übersetzungen „dheomodi“, danach lat. „humilis“ mit der Über- 
setzung „samft-moati“ und wieder lat. „Abba“ mit „faterlih“. Grundsätzlich folgt 
die Glossensammlung (zumindest diese Abschrift) einer alphabetischen Ordnung 
der lateinischen Lemmata, wobei jeweils lateinische Synonyme genannt werden 
(, humilis“ zu „abrogans“, „pater“ zu „abba“). Viele Glossensammlungen folgen 
jedoch der Auftretensreihenfolge im glossierten Text. Die Sammlung der Glossen 
in einer Liste ist aber der erste Schritt einer diagrammatischen Transformation, 
um hinterher die Liste nach eigener Logik weiter zu transformieren. 

Die Listenform erlaubte es auch, verschiedene Sammlungen (also ver- 
schiedene Listen) miteinander zu vereinen und so die Abhängigkeit von einem 
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bestimmten glossierten Text zu verringern (Haß-Zumkehr 2012, 43). Und neben 
einem alphabetischen Ordnungskriterium waren auch sachliche Ordnungen 
gängig. So beispielsweise das Vocabularis Sancti Galli (Isidorus/Hieronymus 775) 
aus der zweiten Hälfte des 8. Jahrhunderts (Haß-Zumkehr 2012, 43). Abbildung 36 
zeigt die erste Seite des Wörterbuches. 


Abb. 36: St. Gallen, Stiftsbibliothek, Cod. Sang. 913, p. 181 - Vocabularius S. Galli 


Es ist somit eine Ausdifferenzierung zu beobachten: Einerseits die sprachnahe 
und vorerst auch werknahe lexikografische Beschreibung von Lemmata, ande- 
rerseits diejenige von sachlich ausgerichteten werkunabhängigen Enzyklo- 
pädien. Erstere gehen mit einem sprachsystematischen Interesse einher und 
zielen im Verlauf der Zeit immer stärker auf vollständige, systematische Erfas- 
sung des Wortschatzes, um universell hilfreich bei der Lektüre und dem Verfas- 
sen von Texten zu sein. Die Wörterbücher lösen sich damit auch allmählich von 
den lateinischen Vorlagen. Im 16. Jahrhundert fallen dann die „Entdeckung der 
Volkssprachen im Humanismus“ (Haß-Zumkehr 2012, 48) und der Buchdruck als 
technologische Erneuerung zusammen und führen zu einer starken Zunahme 
von Wörterbüchern, worunter im deutschsprachigen Raum etwa das Grimm’sche 
Wörterbuch (Grimm/Grimm 1854) besonders bedeutend ist. 
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Der Entwicklung im deutschen Sprachraum gehen ähnliche Entwicklungen in 
anderen Kulturräumen voraus. Für die chinesische Sprache wird in der Forschung 
teilweise das „Yi ching“ (G4), das „Buch der Wandlungen“ als Sammlung von 
Strichzeichen und zugeordneten Bedeutungen, das eine ins 2. Jahrtausend v. Chr. 
zurückgehende Tradition aufweist, als erstes Wörterbuch angesehen (Li 2006, 
362). Deutlicheren Wörterbuchcharakter weisen aber Schriften ab etwa 200 v. 
Chr. auf, etwa das Buch „Erya“ (R#E), das während der Han-Dynastie erschien 
und eine Art Glossensammlung zu klassischen Texten darstellt (Li 2006, 362). 

Ebenfalls Glossen-Charakter weisen die ersten Wörterbücher in Sanskrit, 
ebenfalls mit einer ins 2. Jahrtausend v. Chr. reichenden Tradition, auf (Allan/ 
Hanks 2015). Ähnlich gestaltet sich die Tradition ab dem 5. Jahrhundert v. Chr. 
im klassischen Griechisch, wo Glossen zu bestehenden Schriften hinzugefügt 
worden sind (Stathi 2006; Allan/Hanks 2015). Vom 7. Jahrhundert an sind eine 
Reihe arabischer Wörterbücher entstanden, wobei die Eigenart des geschriebe- 
nen Arabisch, normalerweise nur Konsonanten zu schreiben, zu kreativen Lösun- 
gen der Sortierung führten (Allan/Hanks 2015). 

Die Geschichte der Lexikographie relativiert die oben angestellte Unterschei- 
dung zwischen indexikalischen und lexikographischen Listen. Denn Letztere sind 
ja Ergebnis eines indexikalischen Vorganges: Die Glosse ist der Beginn dessen, 
was nachher zum Index führt, wenn die Glosse den Weg in eine Liste findet. 
Indizierung ist demnach eine Grundmotivation des Erstellens von Listen; im 
Kontext von Schriftsprache führt diese zunächst zu lexikographischen Formen. 
Danach ist aber eine Ausdifferenzierung zu beobachten: Der Index als Liste wird 
als eigenständige Form aufgefasst, die sich definitiv von den Ausgangstexten löst 
und in verschiedene Formate transformiert wird, etwa durch Sortierungen nach 
unterschiedlichen Kriterien. 

In Abschnitt 4.1 beschrieb ich ausführlich Formen dieser Transformationen 
als Verdatung von Sprache. Wenn Indizes über Wörter in Texten vorliegen, können 
diese durch bestimmte Umsortierungen so transformiert werden, dass daraus 
beispielsweise eine Keyword-in-Context-(KWiC)-Liste erstellt werden kann, mit 
der man alle Vorkommen eines bestimmten Lexems im Korpus übersichtlich auf- 
gelistet hat. Oder man kann ein Kollokationsprofil berechnen, das eine Liste der- 
jenigen Lexeme darstellt, die häufig (oder statistisch überzufällig oft) zusammen 
mit dem Basislexem im Korpus auftreten. Solche transformierten Listen erfüllen 
dann auch völlig unterschiedliche Funktionen: Während die Glosse dem unmit- 
telbaren Kommentieren eines bestimmten Ausdrucks im Buch diente, vermitteln 
abstraktere und vom Einzelbeleg gelöste Listen (z.B. eine KWiC-Liste) ein allge- 
meineres Bild über die Wortverwendung. Oder aber ein Index einer Sprache wird 
mit jenem einer anderen Sprache verknüpft, um ein zweisprachiges Wörterbuch 
zu erhalten. 
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Wichtig ist für diesen Zusammenhang, wie ich ihn herstellen möchte, dass die 
digitale Form und die algorithmische Verarbeitung solcher Listen zunächst nicht 
eine völlig neue Qualität der Transformationen und Erscheinungsformen der 
Listen hervorbringt, sondern es sich um grundlegende diagrammatische Ope- 
rationen handelt, die auch manuell vollzogen werden können. Das zeigen etwa 
Wörterbuchprojekte wie z.B. der Thesaurus linguae latinae.” Diese Verdatung 
von Sprache ist also auch analog möglich, wobei die algorithmische Verarbeitung 
natürlich einen enormen Geschwindigkeitsvorteil bringt. Die Kernidee der Verda- 
tung ist in der Indexliste jedoch bereits angelegt. 

Verdatung bedeutet dabei auch, dass für die darauf aufbauenden Transfor- 
mationen die Art der Daten einerlei ist. Ob es sich um sprachliche oder andere 
Daten handelt, ist grundsätzlich egal - wobei aber die Transformationen selbst- 
redend je nach Datentyp unterschiedliche Bedeutungen haben. Die Verdatung 
ermöglicht aber eine gegenseitige Verrechnung unterschiedlicher Datentypen 
und die Anwendung der gleichen Methoden - was aber ebenfalls auch nicht 
bedeutet, dass dies immer sinnvoll ist. 

Die Verdatung geht zwar von Listen aus, führt mit den damit verbundenen 
und möglichen Transformationen jedoch zu einer weiteren diagrammatischen 
Grundform, nämlich den Vektoren. Mit dem Vektor lassen sich beliebige Daten in 
einen mehrdimensionalen Vektorraum überführen, der wiederum neue Operati- 
onen ermöglicht. Dies werde ich in Abschnitt 5.4 weiter ausführen. 


5.2 Karten 


Während die Erstellung von Karten grundsätzlich eine viel längere Tradition 
aufweist, werden erst seit dem 19. Jahrhundert Karten mit sprachlichen Phäno- 
menen in eine explizite Verbindung gebracht. Fine (bekannte) Ausnahme stellt 
allerdings die Sprachenkarte von Mahmoud al-Kashgari dar, der 1073 im „Divanü 
Lugati’t-Türk“ (Mahmüd Ibn-al-Husain al-KaSgari 2007; Mühlhäusler 2010), 
dem „Kompendium der Turk-Sprachen“, eine Weltkarte mit der historischen 
Stadt „Balasagun“, die von der türkischen Herrscherdynastie der Karachaniden 
beherrscht war, im Zentrum. Darauf zeichnete al-Kashgari die verschiedenen ihm 
bekannten Völker und Sprachen ein (vgl. Abbildung 37 auf S. 140). 


38 Vgl. die Ausführungen dazu in Abschnitt 4.1. 
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Abb. 37: Mahmoud al-Kashgaris Karte der Sprachen aus dessen Diwan (11. Jhd.) - Quelle: 
https: //commons.wikimedia.org/wiki/File:Kashgari_map.jpg (letzter Zugriff: 22. 9. 2020) 


Die naheliegendste Verwendung von Karten in der Linguistik bringt Sprachver- 
wendung mit einem geografischen Raum in Verbindung. Dies ist z.B. bei den 
Dialektkarten oder bei Karten zur Verbreitung von Sprachen generell der Fall. 
Damit sind Karten Teil eines geografischen Informationssystems (GIS), also eines 
Systems, das beliebige Daten mit Raumbezug handhabt (Jannidis et al. 2017, 299). 
Damit aus diagrammatischer Sicht Kartografie als „Verzeichnung eines dreidi- 
mensionalen Territoriums auf einer zweidimensionalen Karte gelingt“, miissen 
fünf Bedingungen erfüllt sein (Krämer 2012, 49): Es muss eine Projektionsme- 
thode geben, um die Drei- in die Zweidimensionalitat zu bringen, es muss eine 
externe Beobachterposition eingenommen werden können, es muss ein Koor- 
dinatensystem geben und die Karten müssen einen Maßstab realisieren. Zudem 
bedürfen sie, wie jedes Diagramm, der Generalisierung, Schematisierung und 
Stilisierung (Krämer 2012, 49-50). 
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Zunächst möchte ich am Beispiel der Entwicklung der Dialektgeografie die lin- 
guistische Vereinnahmung der langen Tradition der Kartenerstellung aufzeigen. 
Danach will ich zusätzlich aber auch aufabstraktere Karten zu sprechen kommen, 
die zwar Krämers Bedingungen der Kartografie erfüllen, aber kein geografisches 
Informationssystem mehr sind, da sie keinen Bezug zur Erde oder einem anderen 
Himmelskörper aufweisen. 


5.2.1 Karten in der Variationslinguistik 


Anfang des 19. Jahrhunderts finden sich im deutschsprachigen Raum erste Ver- 
öffentlichungen von Sprachenkarten, denen bald weitere fürs Französische und 
Englische folgen. Die Karten von Schmeller und Klaproth gehören zu den ersten 
(Schmeller 1821; Klaproth 1823). 
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Abb. 38: Verteilung der Mundarten in Bayern nach Schmeller (1821) 
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Johann Andreas Schmeller legte 1821 eine umfangreiche Publikation als Samm- 
lung bayerischer Mundarten vor und im Anhang befindet sich ein „Kärtchen“? 
mit dem Titel: „Zur geographischen Übersicht der Mundarten Baierns mit Bezug 
auf die Zusammenstellung von Seite 427-432“ (vgl. Abbildung 38). Die Karte ist 
mit Kleinbuchstaben übersät, die für bairische Dialekte stehen. In einer mehr- 
seitigen Legende sind für jeden Dialekt wiederum Nummern aufgeführt, die auf 
Sprachmerkmale verweisen, die im Buch erklärt werden (vgl. Abbildung 38). Am 
Ende dieser Liste mit den Buchstaben (also Dialekträumen) a-y sind mit a, ß, y 
noch „Einzelne Dialekt-Aehnlichkeiten ohne geographischen Zusammenhang“ 
(Schmeller 1821, 432) aufgeführt. Die Karte ist also in ein System zweier Index- 
Listen eingebunden und der Versuch, der „Dialekt-Darstellung [...] einen festen 
geographischen Halt [zu geben], welcher auch manchen historischen Anknüp- 
fungspunkt darbietet“ (Schmeller 1821, 30). Dahinter steckt der Wunsch nach 
exakter Verortung: 


Soll nun bey Aufzählung sowohl der allgemeinen als auch der besonderen, nur dieser 
oder jener Gegend eigenthümlichen Dialekt-Erscheinungen nicht blos der größere Bezirk, 
innerhalb welchem sie vorkommen überhaupt, sondern, wo möglich, ihre engere Heimat 
bezeichnet werden: so ist bey dem fixen Stande unserer Bevölkerung das zweckdien- 
lichste Mittel die Angabe der Flüsse, der Gebirge, an oder zwischen welchen sie üblich ist. 
(Schmeller 1821, 30) 


Schmeller möchte dabei „historische und politische Benennungen, wie alleman- 
nisch, schwäbisch, fränkisch, bayerisch, pfälzisch u.s.w.“ vermeiden und statt- 
dessen „so viel möglich durch kurze, rein geographische Hinweisungen beson- 
ders auf Flüsse und Berge“ ersetzen (Schmeller 1821, 31). So beginn die Regel 108 
zur Aussprache zum Vokal a: „108. östlich des Lechs hingegen, so wie am Ober- 
Mayn, an der Altmühl, Pegniz, Nah u.s.w. nur vor sehr entschieden und stark aus- 
gesprochenen oder doppelten Consonanten, z.B. acht, Acker, Amt...“ (Schmeller 
1821, 32). Es ist offensichtlich, dass einiges an geografischem Vorstellungsvermö- 
gen abverlangt wird, um diese Regeln geografisch verorten zu können. Das sieht 
auch Schmeller, wenn er schreibt, dass die „Hinweisungen [...] sich theils aus sich 
selbst erklären, theils durch einen Blick auf die Karte die nöthige Bestimmtheit 
erhalten“ (Schmeller 1821, 31). 


39 So im Titel und Untertitel der Publikation: „Die Mundarten Bayerns grammatisch dargestellt. 
Beygegeben ist eine Sammlung von Mundart-Proben, d.i. kleinen Erzählungen, Gesprächen, 
Sing-Stücken, figürlichen Redensarten u. dergl. in den verschiedenen Dialekten des Königreichs, 
nebst einem Kärtchen zur geographischen Übersicht dieser Dialekte.“ 
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Schmellers Karte gilt fiir ihre Zeit als in einigen Aspekten der Zeit voraus, da 
zwar keine eigentlichen Isoglossen, jedoch sich von den Daten ableitende Groß- 
Dialekträume Bayerns mit feinem Strich markiert sind (Scheuringer 2010, 159). 
Diese deutliche Datenbasiertheit wird durch die streng geografisch motivierte 
Benennungsterminologie ergänzt, so dass irreführende Bezeichnungen wie „Alt- 
bairisch“ oder „Ostfränkisch“ vermieden werden können (Scheuringer 2010, 159). 
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1071. Zufammenftellung 


der verfchledenen Nummern, unter welchen die einzelnen 
Dialett- Eigenheiten aufgeführt find, nad dem getz 
graphifcgen Vorkommen und Zufammenhange 
diefer Eigenheiten, 


A. Ullen Dialeften Baverns gemein: 


14%. 156, 217. 221, 229, 324. 233. 275. 283, 
292. 325. 351. 372. 396. 399, 407. 423.429. 
438. 443.465. 595, 549. 565. 566. 039, 649« 
653. 660. 668, 670, 680, 665-752. 794. 795. 
800, 809. 821, 850, B51, 852, 456, 873. 677. 
` 879. 895. 921. 960. 961.966 - 968, 979. 980, 
988. 1014.1015.1033.1049.1057.,058, 1059, 


N. Nordländifhe Dialekte Bapernsdf.10.): 
Mittel: Rhein, Modu (Unter Mittel: Dbers) Mapn, 
Rejat, Peguiy, Nas, (zum Theily Regen, 

160, 238. 364. 447. 467. 497« 


a Mittels Rhein, Manu, 
131. 171.210, 220, 230, 263. 305. 307. 315, 
366. 380.389. 468. 469. 497. 528, 566.1068. 


& Mittels Rhein, Unters Mayn. 
442. 483. 492. 618, 619, 654. 825. 906. 951, 


Abb. 39: Legende (Ausschnitt) zu Schmellers Karte (Schmeller 1821, 427) 


In der Tradition von Schmeller stehend beginnt vor allem mit Georg Wenkers 
Erhebungen eine rege dialektologische Forschung. Wenker benutzte ab 1876 Fra- 
gebögen mit Sätzen in Standarddeutsch, die von den angefragten Probandinnen 
und Probanden in ihren Dialekt übersetzt werden mussten (Scheuringer 2010, 
160). Die Ergebnisse trug er auf verschiedene Karten ein, die zu einem Atlas mit 
dem Titel „Sprach-Karte der Rheinprovinz nördlich der Mosel“ führten (Wenker 
1878). Die Karten gleichen Schmellers Karte, als dass die Varietäten ebenfalls 
mit Buchstaben auf der Karte markiert und im zugehörigen Buch genauer spe- 
zifiziert werden. Allerdings zeichnet Wenker Isoglossen-Linien ein (Scheuringer 
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2010, 160). Danach weitete Wenker das Untersuchungsgebiet aus, erhob weitere 
Daten und konnte schließlich mit der Unterstützung Otto von Bismarcks bis 1888 
etwa 45.000 Fragebögen im ganzen Deutschen Reich ausfüllen lassen. Daraus 
resultierte im Ergebnis der „Sprachatlas des Deutschen Reiches“ (Wenker 1888; 
Scheuringer 2010, 161). 

Im Sprachatlas wurden für verschiedene Phänomene auf den Ebenen Phono- 
logie, Morphologie und Lexik separate Karten gezeichnet und die Varianten des 
jeweiligen Phänomens für jeden Erhebungspunkt mit grafischen Punktsymbolen 
eingezeichnet. Als zweite Ebene werden areale Interpretationen der Daten mittels 
Isoglossen eingetragen, die meist durch farbig schattierte, dicke Konturlinien die 
Gebiete eingrenzen (Scheuringer 2010, 162). Diese Darstellungsform überlebte 
bis heute - und die alten Karten sind in digitaler Form nutzbar (vgl. Abbildung 
40). Neben der auf Wenker zurückgehenden „Marburger Schule“ waren für die 
Kanonisierung der Dialektkarten auch der „Atlas linguistique de la France (ALF)“ 
und der „Sprachatlas der deutschen Schweiz (SDS)“ verantwortlich (Scheuringer 
2010, 165). Diese beiden Werke unterscheiden sich von den Wenkerkarten insbe- 
sondere in der Datenerhebung, die von linguistisch geschulten Personen durch- 
geführt worden ist. 


+ 


. 
Èi 


BEE 


a 


Abb. 40: Ausschnitt von Wenkers Sprachatlas, Karte 276, VI-23-Wortende: [e]s - anders 
(Wenker 1888), in der digitalen Version „Digitaler Wenker-Atlas (DiWA)“ (Schmidt et al. 2008) 
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Der Unterschied zwischen den dialektgeografischen Atlanten und Mahmoud al- 
Kashgaris Karte ist deutlich: Al-Kashgari entwirft eine Welt der Sprachen und 
Volker, allerdings ohne den Anspruch zu haben, die dahinterliegenden Daten 
sichtbar zu machen. Er berücksichtigt zwar Daten im Hintergrund in Form von 
langen Worterbuchlisten, aber es gibt keine direkte Verbindung zwischen diesen 
und der Karte. Anders verhält es sich mit den Dialektkarten, im Grunde bereits 
bei Schmeller: Die Verteilung sprachlicher Variationsphänomene wird auf der 
Karte selbst eingetragen. Die Platzierung der Daten jedes einzelnen Erhebungs- 
punktes setzt diese in Bezug zu den anderen Daten - sie stellt damit im Sinne 
Krämers Relationalität her (vgl. Abschnitt 2.2) - und modelliert so einen Raum. 
Operieren mit der Karte bedeutet dann u.a. aufgrund der räumlichen Relationen 
Dialekträume ableiten und Isoglossen zeichnen zu können. 

Die traditionelle Dialektgeografie ist stark von monodimensionalen Kar- 
tendarstellungen geprägt: Variation eines angenommenen Basisdialekts wird 
mit geografischem Ort in Verbindung gebracht (Scheuringer 2010, 172). Alleine 
die Berücksichtigung einer zweiten Dimension, z.B. von Zeit, war lange selten, 
wäre aber nötig, um sprachgeschichtliche (auch neuste Sprachgeschichte) mit 
Dialektvariation zu korrelieren. Es gibt Ausnahmen, insbesondere änderte aber 
die digitale Bereitstellung alter und aktueller Karten im Rahmen des Regional- 
sprachen-Portales REDE (Schmidt et al. 2008) die Situation deutlich. Da Karten 
auf einem gemeinsamen Koordinatensystem beruhen (Projektionsabweichungen 
können rechnerisch korrigiert werden), lassen sie sich digital aufeinanderlegen. 
Dies macht die diagrammatische Grundfigur der Karte so mächtig: Karten können 
in Beziehung zueinander und in einen gemeinsamen Koordinatenraum überführt 
werden. Im Fall der Variationslinguistik potenziert sich damit die Datengrund- 
lage für mehrdimensionale Analysen, die zeitliche Veränderungen aber auch 
unterschiedliche Erhebungsmethoden miteinander vergleichen kann. 

Noch weiter geht die Dimensionsanreichung der sich (im Gegensatz zur 
traditionellen Dialektologie) nicht-isolationistisch bezeichnende Geolinguis- 
tik, definiert als „soziologisch informierte Dialektologie“ (Trudgill 1983, 51; zit. 
nach Mühlhäusler 2010, 355). Sie korreliert sprachliche Phänomene mit kogni- 
tiven, physischen, sozialen, ökonomischen und politischen Aspekten und greift 
dabei ebenfalls auf Kartendarstellungen zurück. Ein Paradebeispiel für eine 
solche Analyse ist Trudgills Studie zur Verbreitung des uvularen /r/ - [R] statt 
[r] - ausgehend von Paris um 1600. Er zeigt mit einer Karte einerseits die heutige 
(1970er-Jahre) Verbreitung des uvularen /r/, das in Frankreich, der Westschweiz 
und westlichen Deutschschweiz, in Deutschland, Belgien, Dänemark, Südschwe- 
den und Südnorwegen gebräuchlich ist. Andererseits zeigt eine Karte mit weite- 
ren Angaben zur Häufigkeit in formellen und generellen Registern, dass sich das 
uvulare /r/ nicht einfach geografisch ausbreitete, sondern tendenziell zunächst 
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uvular /r/ : 


not usual_..__.--., 
only in some GF 
educated speech... 

usual in educated 


Map 3: uvular r in greater social detail 


Abb. 41: Karte zur Verbreitung des uvularen /r/ in Europa von Trudgill (1974, 220) 


in urbane Zentren tibersprang und sich von dort weiter ausbreitete (vgl. Abbil- 
dung 41). 

Schließlich darf an dieser Stelle noch der spezifische Fall der dialektometri- 
schen Studien nicht fehlen, die, im Gegensatz zur traditionellen, mit Isoglossen 
arbeitende Dialektologie, von der Grundfrage nach messbaren Distanzen zwi- 
schen Varietäten ausgeht (Goebl 1994). Ein Beispiel ist die Arbeit von Wilbert Jan 
Heeringa (2004) oder die Studien rund um Tobias Streck und Peter Auer (Streck/ 
Auer 2012). Sie verwenden Spontansprachdaten als Grundlage, um daraus eine 
Reihe von Merkmalen und ihre Ausprägungen zu extrahieren und danach diese 
zu clustern. Es ergeben sich also für bestimmte Orte bestimmte Bündel von Merk- 
malen. Orte mit ähnlichen Merkmalsbündeln fallen in den gleichen Cluster. Die 
Clusteranalyse gliedert die Orte dann hierarchisch in einem sich binär verzwei- 
genden umgedrehten Baum — einem Dendrogramm: Ganz am Ende der Veräste- 
lung erscheinen die Orte. Die Distanz zwischen den Clustern kann nun mit Hilfe 
des Dendrogramms als Distanz zwischen den Endpunkten gemessen werden. 
Abbildung 42 zeigt ein Beispiel einer so kartierten Clusteranalyse von Streck und 
Auer (Streck/Auer 2012, 176) für den Alemannischen Raum, mit der sowohl die 
Dialekträume, aber auch die Mischzonen sichtbar werden. 
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Abb. 42: Kartierung der Ergebnisse einer kombinierten Clusteranalyse mit den Verfahren 
„Weighted Average“ und „Group Average“, Rauschfaktor 0,5 / 50 Wiederholungen (r = 0,847) - 
(Streck/Auer 2012, 176) 


Eine bemerkenswerte Vorgängerstudie zu solchen Methoden stellt die Arbeit von 
Karl (auch: Carl) Haag von 1898 dar (Haag 1898, 1901; Streck/Auer 2012, 152). Er 
versuchte die „lautliche[n] Verschiedenheit zwischen Nachbarmundarten“ (Haag 
1901, 235) zu messen, indem er die Aussprachevarianten verschiedener Wörter 
erfasste und so die Distanz zwischen den Dialekträumen berechnen konnte. 
Anhand einer Beispielkarte (vgl. Abbildung 43), die bezüglich Detaillierung 
etwas vereinfacht ist, erklärt Haag das Kartierungsprinzip: 


Ich habe in dieser [Skizze, NB] ganz auf die Angabe der einzelnen Komponenten verzichtet, 
die miteinander die bald mehr, bald weniger tiefen Furchen in das Sprachenfeld graben 
und dasselbe in Landschaften zerlegen, und mich bei der Zeichnung darauf beschränkt, 3 
Stärkegrade in den Linien zu unterscheiden; Stärke 1 entspricht einer lautlichen Verschie- 
denheit zwischen Nachbarmundarten, die sich in 100 bis 200 Wörtern zeigt, Stärke 2 in 200 
bis 400 Wörtern, Stärke 3 in 400 bis 600 Wörtern und darüber; schwächere Verschiedenheit 
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ist nicht berücksichtigt. Man beachte, wie auf diesem Feld die i—ei-Grenze sowol wie die k— 
ch-Grenze dazu verurteilt sind eine hübsche Strecke ihres Wegs in den schmalsten Furchen 
zu laufen. (Haag 1901, 235) 


Die Sprachgrenzen des oberen Neckar- und Donaulands 
nach dem numerischen Stärkegrad dargestellt. 


N 


SS 


Abb. 43: Karl Haags Karte zu Dialekträumen basierend auf einem Distanzmessverfahren (Haag 
1901, 237) 


Methodisch geht Haag ohne Zweifel innovativ vor. Er interessiert sich dafür, 
welche Sprachgrenzen, historischer Lautwandel, aber auch sogenannte ,,Ver- 
kehrsgrenzen“ tatsächlich noch wirkungsvoll sind. Insbesondere liegt ihm auch 
daran, die Wirkung von „Naturschranken“, also topografischen Eigenschaften 
wie Berge, Täler, Flüsse etc. zu relativieren. Ein Rezensent, Karl Bohnenberger, 
kritisiert diese Relativierung: 


Karten — 149 


Unter den sprachschneidenden Verkehrshindernissen wiegen in der Schwenninger Gegend 
die historischen Grenzen sehr vor gegen die natiirlichen. H. betont dies auch sehr bestimmt, 
wie mir scheint, etwas einseitig. Das Gelände bietet schon gar nicht so viel Anlass zu natür- 
lichen Grenzen als man auf den ersten Blick annehmen könnte. Vom Schwarzwald rückt 
nur der verhältnismäßig flache und wenig durchschnittene Ostrand in die Karte herein. 
Die Alb ist wol mit beträchtlichen Steilabfällen und dem hohen und stark abgeschnitte- 
nen Heuberg vertreten, aber die wenigen Orte des Heubergs unterliegen der Beeinflussung 
von beiden Seiten, weil sie kein Hinterland haben, an das sie sich anlehnen könnten. 
Von tiefeinschneidenden Flusstälern wirken, wie H. selbst sieht, das Wutachtal und das 
Beeratal sprachscheidend. Neckar und Donau werden, wo sie tiefer einschneiden, von den 
Sprachwellen quer getroffen und sind deshalb nicht geeignet diese aufzuhalten. Hat man 
sich auf diese Dinge etwas eingelesen, so findet man doch noch mehr natürlich bedingte 
Sprachgrenzen heraus, als H. zugeben will. Ich halte es nicht für überflüssig, auch hier aus- 
drücklich zu betonen, dass neben Berg und Tal auch Wald und Ried in Betracht zu ziehen 
sind. Auch anderwarts treten die natürlichen Grenzen nicht in großen Zügen hervor, man 
muss sie von Ort zu Ort heraussuchen. (Bohnenberger 1900, 146) 


Auffallend ist die metaphorische Sprachverwendung, die von der topografischen 
Beschreibung auf sprachliche Prozesse überschlägt. Flüsse „schneiden“ nicht 
nur Täler in die Landschaft, sondern Täler wirken auch „sprachschneidend“ 
und können von „Sprachwellen“ getroffen werden und sie aufhalten — oder eben 
nicht aufhalten. 

Obwohl Haag inhaltlich Bohnenberger widerspricht, argumentiert er genau 
so topografisch: 


[...] wenn nun schon die Ergebnisse des Einzelgrenzenverfolgs zeigen, dass Lautgrenzen 
sehr oft auf politischen allein, sehr selten auf physikalischen (selbstverständlich unzwei- 
deutigen) allein ruhen, so zeigt das Gesamtbild weiter noch die große Tatsache, dass dicke 
Lautgrenzenbündel nur an politischen Grenzen auftreten. Diese bei jeder Untersuchung 
von Ort zu Ort zu Tage getretene überragende Bedeutung der politischen Schranken lässt 
die zuerst nur praktische Forderung, ausschließlich schwere Naturschranken ins Auge zu 
fassen, nun auch theoretisch berechtigt erscheinen. Und gegen diese Forderungen versto- 
ßen B.’s Untersuchungen meines Erachtens allzusehr. Wälder von kaum 3 km Breite (Mun- 
delfingen), Hügel von 50 m Höhe (Zässingen), Verengung von flachen Tälchen (Sept), ver- 
dienen entschieden keine Beachtung. Ich weiß recht wol, wie lockend es ist sich auf der 
Spezialkarte zu ergehen und die reichen Formen des Geländes auf die verbindende und 
trennende Wirkung hin zu prüfen, die sie auf die in ihrem Schoße ruhenden menschlichen 
Siedelungen haben mögen; aber hier muss man Entsagung üben und die naturfrohe Phan- 
tasie zügeln, um nicht von ihr in die Irre geführt zu werden. (Haag 1901, 232) 


Er ist sich allerdings der Gefahr bewusst, die von der Karte ausgeht, wenn er 
fordert, die „naturfrohe Phantasie“ zu zügeln. 

Wenn man Karten aus der Anfangszeit der Dialektologie (z.B. die Wenker- 
Karten) mit späteren vergleicht, tritt ein Aspekt des Wandels deutlich hervor: 
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Auf den älteren Karten sind oft mehr topografische Merkmale eingezeichnet (ins- 
besondere Gewässer) und die Datenpunkte geben eine nominale Datenstruktur 
wieder (Ausprägung der Variable). Eine Karte, als Ergebnis einer Clusteranalyse 
von Dialektmerkmalen, wie jene in Abbildung 42, zeigt gerade noch die Umrisse 
der Erhebungsorte und nennt die wichtigsten Ortschaften, ist ansonsten aber 
abstrakt. Dafiir werden solche Karten mit quantitativen Angaben zu verschie- 
denen Variablen (meist mit metrischem Skalenniveau) kombiniert (vgl. etwa 
die Übersicht von Karten bei Veith 1994). Parallel dazu ändern sich auch die 
Beschreibungen zu den Karten — bei Haag und Bohnenberger ist die Verhaftung 
in der topografischen Karte noch deutlich sichtbar. Dies spiegelt die Verände- 
rung der Forschungsparadigmen wider, die sich weg von einem deutlichen Fokus 
auf die areale Verbreitung hin zu einer mehrdimensionalen Variationslinguistik 
bewegen (Scheuringer 2000; Macha 2005). 

Die Arbeiten der Pioniere der Dialektologie können auch als Reaktion auf die 
Forschungsparadigmen der Junggrammatiker im ausgehenden 19. Jahrhundert 
gelesen werden. Deren Sicht auf Sprache als mit naturwissenschaftlichen, sys- 
tematischen Methoden zu bearbeitendes Objekt und der Annahme eines starren 
Systems von Gesetzen, z.B. zum Lautwandel, klammert kulturhistorische und 
gesellschaftliche Dimensionen weitgehend aus. In der Dialektologie zeigt sich 
ein anderes Bild: Raumzeitliche Variation, kulturelle Einflüsse, Kontaktphäno- 
mene etc. (Gardt 2012, 287) werden berücksichtigt. Die diagrammatische Praxis 
in der Dialektologie nimmt jedoch deutlich den datengeleiteten, empirischen 
Zugang der Junggrammatiker auf, indem Daten zu Aussprachevarianten syste- 
matisch erhoben, auf Karten dargestellt und gedeutet werden. Die oben zitierten 
Texte von Haag und Bohnenberger sind Zeugen dieser Positionierung im Span- 
nungsfeld zwischen naturwissenschaftlichem Gestus einerseits und kultureller 
Deutung andererseits. Selbst Spuren einer Verknüpfung physiologischer Fakto- 
ren mit Sprache finden sich in den Interpretationen, wenn topografische Form 
und sprachliche Varietät diskutiert werden. Diese Verknüpfungen gehen auf die 
sogenannte Klimatheorie zurück, die einen Zusammenhang zwischen Klima und 
Sprache konstruiert und in der romantischen Sprachreflexion etwa mit August 
Wilhelm Schlegel stark zunimmt (vgl. dazu ausführlich Gardt 2012, 308/240). 


5.2.2 Nichtgeografische oder kaumgeografische Karten 


Neben den geografischen Karten, wie ich sie im vorangehenden Abschnitt 
beschrieben habe, gibt es noch eine Klasse von Karten, die ich als nichtgeo- 
grafisch oder kaumgeografisch bezeichnen möchte. Darunter fällt zunächst die 
Wortwolke (vgl. Abschnitt 2.3.4), die Orientierung in einer großen Menge von 
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Schlagworten bieten soll. Diagrammatisch gesehen lässt sich die Wortwolke 
als Verwandte der Darstellung von Text auf geografischen Karten ansehen: Mit 
der Beschriftung von Karten entwickelte sich ein System, die Wichtigkeit der 
Beschriftung durch Typografie auszudrücken, etwa in unterschiedlichen Schrift- 
größen oder Schriftschnitten (kursiv, fett, gesperrt etc.). Die Anordnung der Texte 
auf der Fläche richtete sich nach den zu beschreibenden geografischen Entitäten. 
Diese Anordnung funktioniert bei Wortwolken natürlich anders, die restlichen 
Darstellungsprinzipien bleiben jedoch erhalten. Deswegen handelt es sich um 
eine nichtgeografische Darstellung. Aufgrund der diagrammatischen Nähe zum 
Prinzip der Kartenbeschriftung schlage ich trotzdem vor, von Karten zu reden. 
Der Verlust der geografischen Referenz als Ordnungsprinzip ist dabei nicht so 
einfach zu kompensieren, weshalb Wortwolken als ein problematisches Darstel- 
lungsmittel gesehen werden müssen (vgl. Abschnitt 2.3.4). Die Position ist nicht 
zwingend semantisiert, was bei Kartenbeschriftungen anders ist. 

In Abschnitt 6.2.5 werde ich im Zusammenhang der Visualisierung von Geo- 
kollokationen unsere Darstellung von Dorling-Karten präsentieren, die darauf 
abzielen, die geografisch gebundene Kartendarstellung zu abstrahieren und eine 
andere Dimension anstelle der genauen geografischen Lokalisation und Form 
stärker zu gewichten. Die klassische Dorling-Karte (Dorling 1993) verändert etwa 
die Größe von darzustellenden Ländern oder anderen administrativen Einheiten 
derart, dass die Größe eine weitere Variable, beispielsweise Bevölkerungszahl, 
Wirtschaftskraft o.ä., repräsentiert. Dadurch kommen verzerrte Kartenbilder 
zustande. Je weiter die Darstellung von der geografischen Karte abstrahiert wird, 
desto eher könnte von einer „kaumgeografischen“ Karte gesprochen werden, da 
die geografische Referenz immer unwichtiger und undeutlicher wird. Bei unserer 
Dorling-Visualisierung der Geokollokationen ist es etwa möglich, sich nur wenige 
Länder auszuwählen und bezüglich ihrer Kollokatoren zu vergleichen. Die Dar- 
stellung hat dann keinen (sichtbaren) geografischen Bezug mehr; dieser kann 
jedoch mit einem Mausklick sofort wieder hergestellt werden, wenn die Isolie- 
rung auf bestimmte Länder aufgehoben wird. 


5.3 Partituren 


Die dritte diagrammatische Grundfigur, die in der Linguistik eine bedeutende 
Rolle spielt, ist die Partitur. Diese Figur stammt aus der Musik, wo sie zur Nota- 
tion von Polyphonie verwendet wird. Für die Linguistik relevant ist die Über- 
nahme der diagrammatischen Grundfigur insbesondere in der Gesprächsana- 
lyse, konkret zur Gestaltung von Gesprächstranskripten. Doch zunächst soll ein 
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Blick in die Geschichte der Notation von Musik dazu dienen, die Eigenschaften 
und Leistungen der Partiturnotation zu verstehen. 


5.3.1 Partituren in der Musik 


Polyphone Musik erscheint uns grundsätzlich in zwei Arten: Als Ensemble- (oder 
Orchester-)Musik, bei der mehrere Instrumente gleichzeitig gespielt werden, 
oder als Solo-Musik, bei der auf einem Instrument mehrere Stimmen gespielt 
werden, etwa die linke und recht Hand bei einem Tasteninstrument (Apel 1961, 
XXV; Sachs/Röder 1989). In solchen Fällen muss ein Weg gefunden werden, die 
Gleichzeitigkeit der Töne grafisch zu fixieren, d.h. die verschiedenen Stimmen 
parallel notieren zu können. Eine Lösung dazu bietet die Partiturschreibweise. 
Aus dem 9. Jahrhundert sind Vorläufer dieser Schreibweise bekannt. Als Beispiel 
wird dabei etwa die Musica enchiriadis angesehen, eine Art Handbuch für den 
Unterricht des Singens von Gregorianischen Chorälen (vgl. Abbildung 44). Dort 
werden sich im Quint- oder Quartabstand stets parallel bewegende Stimmen im 
gleichen Notensystem notiert. Auf der vertikalen Achse ist das Notensystem wie- 
dergegeben, zunächst in sogenannter Dasia-Notation bzw. Dasia-Schrift, später 
mit Tonbuchstaben wie in Abbildung 44. Mit dem einheitlichen Notensystem in 
der Vertikalen ergibt sich sozusagen automatisch eine Art Partiturschreibweise 
in der Horizontalen, wenn dort die Melodie abgetragen wird, wobei die genaue 
vertikale Übereinstimmung der beiden Melodien sekundär ist (Sachs/Röder 1989, 
1426). Es wird angenommen, dass diese Art der Notation weniger für die direkte 
Wiedergabe des Gesangs gedacht war, sondern mit einem didaktischen Nutzen 
verbunden war, durch die „Verbindung von Hören und Sehen [...] leichter klarzu- 
machen, wie man sich den Intervall-Bezug zwischen den Tönen vorzustellen hat“ 
(Sachs/Röder 1989, 1426). Es handelte sich also um eine synoptische Darstellung, 
um die Komplexität des Stückes abbildbar zu machen. Das ist eine Funktion, die 
den naiven Blick auf Musiknotation ergänzt, bei dem man zunächst an den Zweck 
der Aufführungspraxis denkt. 

Bis ins 15. Jahrhundert hinein wird bei partiturähnlichen Notationen keine 
exakte vertikale Anordnung angestrebt. Um dies zu ermöglichen, musste sich 
erst ein System der Notation von Tonlängen und Taktstrichen entwickeln. Damit 
einher geht die Tendenz, für jede Stimme separate Notensysteme zu verwenden, 
etwa 1537 bei Lampadius (vgl. Sachs/Röder 1989, 1431). Doch auch dann spielten 
die Partituren oft eine eher nebensächliche Rolle, da sie eher als Vorlage genutzt 
wurden, um die Einzelstimmen daraus zu extrahieren, die dann sowohl für die 
Aufführung, als auch dem Dirigenten/der Dirigentin als Grundlage dienten. Erst 
im weiteren Verlauf des 16. Jahrhunderts wurde die heute bekannte Partitur 
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Abb. 44: Beispiel aus der Musica Enchiriadis, Dasia-Notation zweier Stimmen. Msc.Var.1.fol51r, 
Staatsbibliothek Bamberg (Hoger <von Werden> et al. 1000) 


gängiger, um als Aufzeichnungssystem zu dienen, „ein (fremdes) Werk genauer 
prüfen zu können“, und dazu, aus „aufführungspraktischen Zwecken [...] ein Tas- 
teninstrument, in der Regel die Orgel, als Stütze heranzuziehen“ (Sachs/Röder 
1989, 1429). 

In der Musik diente die Partitur grundsätzlich immer dazu, die Gleichzeitig- 
keit der Stimmen und damit ihre Bezüge zueinander darzustellen - im Laufe der 
Entwicklung immer systematischer und genauer. Für polyphon spielbare Inst- 
rumente, wie z.B. Tasteninstrumente, ist die Partiturdarstellung auch im Inst- 
rumentenauszug zwingend, bei anderen Instrumenten nicht. Dort ist sie für die 
Wiedergabe des Stückes nicht unbedingt nötig, doch immer dienen Teil- oder 
Komplettpartituren der Übersicht. Die Partitur erlaubt einen neuen holistischen 
Blick auf ein Musikstück, indem die zeitliche Interaktion der Stimmen sichtbar 
wird - sie visualisiert die Gleichzeitigkeit von grundsätzlich Gleichwertigem. Das 
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ist ein Unterschied zu anderen diagrammatischen Möglichkeiten, Gleichzeitig- 
keit auszudrücken, z.B. zu den Glossen oder Marginalien (vgl. dazu Abschnitt 
5.1). Diese sind Ausdruck einer Priorisierung — eben einer Marginalisierung - und 
optionale, später hinzugefügte Ergänzung. 


5.3.2 Partitur in der Gesprächsanalyse 


In der Linguistik ist uns nun im Kontext der Transkription von gesprochener 
Sprache“ der Begriff „Partiturschreibweise“ bekannt. Diese Bezeichnung scheint 
auf den Vorschlag von Konrad Ehlich und Jochen Rehbein für ein Transkriptions- 
system, nämlich die „Halbinterpretative Arbeitstrankriptionen (HIAT)“ zurück- 
zugehen (Ehlich/Rehbein 1976), wobei die Gruppe das Transkriptionsverfahren 
vor der Publikation 1976 bereits „seit mehreren Jahren für die Transkription von 
Sprachdaten mit mehr als zwei oder drei Sprechern [...] ausgearbeitet und erprobt 
worden ist“ (Ehlich/Rehbein 1976, 21). Mit HIAT zielten die Erfinder darauf, ein 
einfaches, schnell erlernbares System zu haben, das zu leicht verwendbaren Tran- 
skripten führt. HIAT versammelt eine Reihe von Transkriptionsregeln, die nicht 
im einzelnen diskutiert werden sollen; interessant ist der Abschnitt zur „Wieder- 
gabe der turn-übergreifenden Daten“ (Ehlich/Rehbein 1976, 25-30) und dann 
insbesondere zur „Partiturschreibung“ (Ehlich/Rehbein 1976, 26-29). Zunächst 
wird konstatiert, dass die „Wiedergabe simultaner Sprechvorgänge [...] auf zwei 
Schwierigkeiten“ stoße, nämlich „die akustische Diskriminierung der verschie- 
denen Äußerungen“ und die „adäquate und übersichtliche graphische Wieder- 
gabe“ (Ehlich/Rehbein 1976, 26). Um letztere Schwierigkeit zu überwinden, schla- 
gen die Autoren „eine Wiedergabeform [vor], die sich — wie schon einige Zeichen 
unter 82.1.5. — an die graphische Aufzeichnung akustischer Phänomene in der 
Musik anlehnt, u.z. die Partitur [Hervorh. im Original] (Ehlich/Rehbein 1976, 
26). Der erwähnte § 2.1.5. gibt die Kennzeichnung von modulatorischen Phänome- 
nen vor: leise / lauter werden, Stakkato, betont, gedehnt, ungewöhnliche Hebun- 
gen und Senkungen. Für die Lautstärkemodulation werden die auch in der Musik 
üblichen Zeichen für Crescendo (<) und Decrescendo (>) vorgeschlagen (Ehlich/ 
Rehbein 1976, 25). 


40 Ich meine damit Teildisziplinen wie die Konversations- und Gesprächsanalyse sowie die in- 
teraktionale Linguistik. Da die methodologischen und theoretischen Unterschiede zwischen die- 
sen Ansätzen für die folgende Argumentation irrelevant sind, meine ich mit „Gesprächsanalyse“ 
und ähnlichen Ausdrücken alle diese Ansätze, die gesprochene Sprache unter linguistischen 
Gesichtspunkten analysieren. 
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Abbildung 45 zeigt ein Beispiel einer Transkription in Partiturschreibweise 
im HIAT-Regelwerk. Die Autoren erklären ausführlich die Notationsregeln und 
betonen, dass die Zeilen bei einzeiligen Transkriptionsverfahren 


zu einer Fläche [erweitert werden], in der die Äußerungen aller Sprecher während eines 
Zeitintervalls aufgetragen werden, und zwar zeitlich relativ zueinander |...] | - das] Darstel- 
lungsmittel der Simultaneität ist also die Beziehung der Zeilen zueinander. (Ehlich/Rehbein 
1976, 27) 


Die entstehenden Flächen werden von den Autoren als „Simultanflächen“ 
bezeichnet. Mit der grafischen Markierung der eckigen Klammer wird die Fläche 
markiert, so dass deutlich ist, welche Zeilen jeweils als Einheit, als Partiturzeile, 
aufgefasst werden müssen. 


Beispiel (11) 
L [ Ihr. fragt mal eure Eltern, sprecht mit denen darüber, 
L und dann sagt ihr mir am Dienstag Bescheid .. was sie ge- 


bißchen leiser 


donnerstags oder Dienstags? 
Äh... wi./äh 


Bitte? Wie das heißt, ja. „der Feuer- 


L 
| meint haben Vivian 
[ heißt denn das? Wie das hei/ . wie das Stü(ck) 


[ vogel“. 


Abb. 45: Beispiel einer Transkription in Partiturschreibweise bei Ehlich und Rehbein (Ehlich/ 
Rehbein 1976, 28) 


Selbstverständlich verweisen die Autoren auf das Problem der grafischen Reprä- 
sentation der vertikalen Alignierung, da „die Breite der Buchstaben keineswegs 
der zeitlichen Realisierung der durch sie dargestellten Phoneme entspricht“ 
(Ehlich/Rehbein 1976, 28). Sie schlagen die Verwendung von Leerraum zum Aus- 
gleich oder grafische Zeichen zur Verdeutlichung der Alignierung vor. 

Wie bereits oben angedeutet, steht die musikalische Notation auch bei der 
Angabe zur Modulation Pate. Der Aspekt der Intonation und insbesondere der 
Angaben zu Tonhöhen und Tonhöhenbewegungen wird in der zu „HIAT 2“ erwei- 
terten Fassung von Ehlich und Rehbein (1979) ausführlich diskutiert. Seit den 
1960er-Jahren gibt es Diskussionen dazu, wie Tonhöhen transkribiert werden 
könnten und die Inspirationsquelle Musiknotation liegt dabei auf der Hand, 
wenn man eine Parallelität zwischen Tonhöhenverläufen in der gesprochenen 
Sprache und der Musik sieht, insbesondere begründet durch die Notation von 
Gesang. Fönagy und Magdics (1963) verwenden beispielsweise eine klassische 
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Notennotation, um verschiedene Intonationsmuster zu visualisieren. Später 
wurde eine Vielzahl von mehr oder weniger stark davon abstrahierten Systemen 
vorgeschlagen, um Tonhöhen und Prosodie in gesprochener Sprache zu notieren 
(vgl. für eine Übersicht Ehlich/Rehbein 1979, 59-66; ferner Selting 2001). Diese 
sind meist stark von der musikalischen Notation inspiriert, trotzdem sind sie für 
die Idee der diagrammatischen Grundfigur Partitur nicht relevant, da es dabei 
ja nicht um die Darstellung von Simultaneität von Sequenzen geht. Allerdings 
bereitet die Nähe der Intonation zu Musik gewiss das Feld vor, um auch weitere 
Prinzipien der Musiknotation in die Gesprächstranskription zu übernehmen. 

Ebenso muss betont werden, dass auch vor Ehlich und Rehbeins (zumindest 
publizierten) Vorschlag Ansätze für partiturartige Transkriptionen vorgeschlagen 
worden sind. Dazu gehört der für den englischsprachigen Raum relevante Vor- 
schlag von Harvey Sacks, Emanuel Schegloff und Gail Jefferson (1974) für eine 
„simplest systematics for the organization of turn-taking for conversation“. Sie 
gehen vom Phänomen überlappender Sprecherbeiträge aus und schlagen im 
Anhang des Beitrags, der erstmals den Begriff „turn“ in einem konversations- 
analytischen Zusammenhang nennt, dafür spezielle Zeichen vor: insbesondere 
den doppelten Schrägstrich (//), um Passagen der Überlappung markieren zu 
können. Damit muss jedoch die Zeilensystematik der Transkription nicht auf- 
gebrochen werden; es ist keine vertikale Positionsübereinstimmung notwendig. 
Diese kann jedoch durch ein Klammerzeichen angezeigt werden (vgl. Abbildung 
46). Damit wird eine minimale Form der diagrammatischen Grundfigur Partitur 
übernommen. Im ganzen Text finden sich jedoch keinerlei expliziten Bezüge zur 
Musiknotation. 


SEQUENCING. The transcription of sequential features is done with special care, 
using the following conventions: 

The double oblique (//) indicates the point at which a current speaker’s talk is overlapped 
by the talk of another: 

V: Th’ guy says tuh me- ‘hh my son // didid. 
M: Wuhjeh do:. 

A multiple-overlapped utterance is followed, in serial order, by the talk which overlaps it. 
Thus C’s ‘Viie * occurs simultaneously with V’s ‘left’, and her ‘ Victuh’ occurs simultaneously 
with his ‘hallway’: 

V: I// left my garbage pail in iz // hallway. 
€: Vi:c, 
C: Victuh, 

An alternate system is to place a single bracket at the point of overlap, and place the over- 

lapping talk directly beneath the talk it overlaps: 
V: Th’ guy says tuh me- "hh my son been 
M: Wuhjeh do:. 


In front of two serially transcribed utterances, the bracket indicates that they start simul- 
taneously: 


M: [I mean no no n'no. 
V: [P'tit back up, 


Abb. 46: Markierung von überlappenden turns bei Sacks et al. (1974, 731) 
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Der Beitrag von Sacks et al. ist aber bekannterweise innovativ und einflussreich, 
da er das Phänomens des „turn-takings“, also der Organisation von Redebeiträ- 
gen in natürlichen Gesprächen erstmals systematisch untersucht: 


Here, on the basis of research using audio recordings of naturally occurring conversations, 
we attempt to characterize, in its simplest systematic form, the organization of turn-taking 
for conversation, and to extract some of the interest of that organization. (Sacks et al. 1974, 
697) 


Die Autoren legen also Wert auf die empirische Grundlage, die zur Systematik des 
turn-takings führte. Die Frage der Transkription wird allerdings im Beitrag nicht 
ausführlich problematisiert, sondern auf den Anhang verwiesen, der die Regeln 
der verwendeten Transkription offen legt. Wie wichtig die Transkription für die 
neue Sicht auf die Daten ist, die Sacks et al. einnehmen, wird von den Autor/ 
innen nicht explizit gemacht. Implizit jedoch wird die Wichtigkeit insofern deut- 
lich, als die Autor/innen eigens für ihre Art von Analysen ein eigenes Transkrip- 
tionssystem entwickeln, das so neu und andersartig ist als die bisherigen Ver- 
schriftlichungen von gesprochener Sprache, dass es im Anhang detailliert erklärt 
werden muss. Insbesondere gehen die Autor/innen davon aus, dass im Gespräch 
Überlappungen völlig normal sind: „Occurrences of more than one speaker at a 
time are common, but brief“ (Sacks et al. 1974, 700). Meistens würde in Gesprä- 
chen nur eine Person zugleich sprechen, aber beim turn-Wechsel komme es also 
regelmäßig zu Überlappungen. In den Transkriptionsregeln ist dann die Markie- 
rung von Überlappungen auch das erste behandelte Thema. 

Erhellend sind die Anmerkungen der Autor/innen im Anhang. Dort machen 
sie nochmals deutlich, dass die zitierten Transkripte im Text nur illustrativ seien 
und eine viel größere Kollektion von Daten repräsentieren würden. Und „any 
materials of natural conversation (transcribed to an appropriate level of detail 
and precision) collected by others may be examined as well“ (Sacks et al. 1974, 
734). Einerseits betonen die Autoren also die empirische Fundierung, anderer- 
seits aber auch die Notwendigkeit einer genug detaillierten und präzisen Tran- 
skription. 

Mit dem „Gesprächsanalytischen Transkriptionssystem GAT“ von Margret 
Selting et al. (1998) existiert ein weiteres, sehr gebräuchliches Transkriptionssys- 
tem, ein 


Vorschlag für ein einheitliches gesprächsanalytisches Transkriptionssystem [...], das keine 
stark theoriegebundenen Vorannahmen macht und daher von Linguistinnen und Linguis- 
ten unterschiedlicher theoretischer Zugehörigkeit verwendet werden kann. (Selting et al. 
1998, 92) 
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Im Gegensatz zu HIAT verwendet es keine vollständige Partiturschreibweise: 


Neue Sprecherbeiträge (Turns), die ohne Simultansprechen einsetzen, beginnen mit einer 
neuen Transkriptzeile. Das Untereinander der Zeilen bildet ikonisch das Nacheinander der 
Sprecherbeiträge ab. Es wird also keine Partiturschreibweise verwendet. (Selting et al. 1998, 99) 


Aber auch hier wird eine Notation vorgeschlagen, um überlappendes Sprechen 
zu markieren, nämlich das Einfassen der parallel gesprochenen Sequenzen mit 
eckigen Klammern (vgl. Abbildung 47). Ähnlich wie beim Vorschlag von Sacks et 
al. handelt es sich hierbei tatsächlich nicht um eine reine Partiturschreibweise, 
aber dadurch, dass bei Überlappungen doch eine vertikale Alignierung eingehal- 
ten wird, öffnet sich auch hier eine Fläche, die in ihrem Prinzip dem der Partitur 
durchaus ähnlich ist. Allerdings wird dies, anders als man es in Partiturschreib- 
weise machen würde, nicht konsequent durchgehalten. Auch in seiner Überarbei- 
tung als GAT 2 wurde von diesem Prinzip nicht abgewichen (Selting et al. 2009). 


01 A: eigentlich wollt ich jetzt [noch sa’ 

02 B: [das tut nichts [zur sache 

03 A: [noch sagen 
04 daß mich diese ständige unterbrecherei einfach stört. 


Abb. 47: Beispiel für die Notation von Überlappung in GAT (Selting et al. 1998, 99) 


Zusammenfassend ist für die Transkription für Konversations- und Gesprächs- 
analysen oder in der interaktionalen Linguistik zu konstatieren, dass die expli- 
zite, vollständige Partiturschreibweise zwar meist nicht eingesetzt wird, die dia- 
grammatische Grundfigur Partitur jedoch (implizit, unbewusst) immer leitend zu 
sein scheint und den spezifischen Blick solcher Analyseansätze überhaupt erst 
ermöglichte. 

Eine fundamentale Wende erbrachten zudem moderne Softwaretools zur 
Transkription: Symptomatisch ist beispielsweise das weit eingesetzte System 
EXMARaLDA (Schmidt 2016b), bei dem die Transkription im „Partitur-Editor“ 
erfolgt und eine Alignierung mit Audio- und/oder Video-Aufnahmen möglich ist 
(vgl. Abbildung 48). Dadurch ist eine genaue Segmentierung und vertikale Alig- 
nierung der Gesprächsbeiträge sinnvoll, was in einer einer Partitur nachempfun- 
denen Schnittstelle geschieht. Diese Schnittstelle ist darüber hinaus noch weitaus 
konsequenter, als die meisten Partituren in der Musik, dasie nämlich nicht umbro- 
chen ist, sondern von links nach rechts beliebig weit gescrollt werden kann. 

Die Daten werden in einem XML-Format gespeichert und können in eine 
Reihe anderer Formate konvertiert werden — so auch in ein Transkript nach dem 
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GAT-Standard (Schmidt et al. 2015), wo dann keine durchgängige Partiturdarstel- 
lung mehr sichtbar ist und Uberlappungen mit eckigen Klammern ausgedriickt 
werden. Anhand der Software sieht man aber, dass die diagrammatische Grund- 
figur der Partitur so wirkmächtig ist, dass sie das leitende Prinzip bei der soft- 
wareunterstützten Transkription ist, auch wenn nicht alle Transkriptionskonven- 
tionen diese Schreibweise fordern. 


Abb. 48: Bildschirmfoto der Software EXMARaLDA mit ausgeprägter Partituranordnung 
(Schmidt 2016b) 


Partituren sind also dazu da, Polyphonie, Vielstimmigkeit und Gleichzeitig- 
keit festzuhalten. Es handelt sich um Sequenzen, die zeitgleich stattfinden. Es 
ist typisch für das Problem, dass es diagrammatisch gelöst werden muss, denn 
ein wichtiges Merkmal von Diagrammen ist ja ihre synoptische Qualität, die 
sie durch Flachigkeit erreichen (vgl. Abschnitt 2.2). Davon zeugt nur schon die 
Benennung „Simultanfläche“ von Ehlich und Rehbein bei der Beschreibung der 
Partiturschreibweise von HIAT. 

Auffällig ist zudem, dass in Partituren die jeweiligen „Stimmen“ als grund- 
sätzlich gleichwertig bezüglich ihrer qualitativen Beschaffen aufgefasst werden 
können. Das ist bei Gesprächstranskripten genauso wie bei polyphoner Musik. 
Natürlich können die jeweiligen Stimmen unterschiedliche Funktionen einneh- 
men, beispielsweise bei Gesprächen, wo die eine Stimme teilweise sogenanntes 
Back-Channel-Behaviour zeigt, also mit „ja“, „hm“ etc. Zuhören signalisiert, aber 
das Gespräch nicht dominiert. Diese Stimme ist jedoch qualitativ von gleicher Art 
wie die andere und kann für die Gesprächsorganisation genauso wichtig sein. 
Man würde sie deshalb bei der Transkription nicht als optionale Anmerkung, 
d.h. als Glosse o.ä. auffassen wollen. 

Während die diagrammatische Grundfigur der Partitur bei Gesprächstran- 
skripten offensichtlich ist - und teilweise auch explizit genannt wird -, lohnt 
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sich der Blick auf weniger offensichtliche Visualisierungen, die auf ihr beruhen 
und die im nächsten Abschnitt diskutiert werden. 


5.3.3 Partituren in weiteren Formen 


Eine Form, die auf der diagrammatischen Grundfigur der Partitur beruht, ist 
der sogenannte „vertikalisierte Text“, wie er in computer- und korpuslinguisti- 
schen Kontexten häufig anzutreffen ist. Man versteht darunter eine tabellenartige 
Struktur, die Annotationen auf Wortebene wiedergibt. Tabelle 9 zeigt ein Beispiel 
von Annotationen zu einem Satz in dieser Form. Es handelt sich um einen Satz, 
der vom maschinellen Dependenzparser ParZu (Sennrich et al. 2009) bearbeitet 
worden ist. 


Tab. 8: Ausgabe des Dependenzparsers ParZu (Sennrich et al. 2009), https: //pub.cl.uzh.ch/ 
demo/parzu/ (letzter Zugriff: 22.9. 2020) 


1 Während während KOUS KOUS _ 10 konj 
2 die die ART ART Def|Fem|Nom|Sg 4 det 


3  diagrammatische diagrammatisch ADJA ADJA Pos|Fem|Nom|Sg|_| 4 attr 


4 Grundfigur Grundfigur N NN Fem|Nom|Sg 10 subj 
5 der die ART ART Def|_|Gen|_ 6 det 
6 Partitur Partitur N NN _|Gen|_ 4  gmod 
7 bei bei PREP APPR Dat 10 pp 
8  Gesprächstran- Gesprächstran- N NE _|Dat|_ 7 pn 
skripten skripten 
9 offensichtlich offensichtlich ADV ADJD Pos| 10 pred 
10 ist sein Vv VAFIN 3|Sg|Pres|Ind 12 neb 
11, f $, $, E 0 root 
12 lohnt lohnen vV VVFIN 3|Sg|Pres|ind 0 root 
13 sich sie PRO PRF 3|_l_ 12 obja 
14 der die ART ART Def|Masc|Nom|Sg 15 det 
15 Blick Blick N NN Masc|Nom|Sg 12 subj 
16 auf auf PREP APPR Acc 15 pp 


17 weniger wenige ART PIAT ILL 19 det 
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Tab. 8: (fortgesetzt) 


18 offensichtliche offensichtlich ADJA ADJA Pos|_|Acc|_|_| 19 attr 
19 Visualisierungen Visualisierung N NN Fem|Acc|PL 16 pn 
20 , . $, $, _ 0 root 
21 die die PRO PRELS Fem|NomjPl 24 subj 
22 auf auf PREP APPR Dat 24 objp 
23 ihr ihr PRO PPER 3]Sg|Fem|Dat 22 pn 
24 beruhen beruhen V VVFIN 3[|Pl|Pres|_ 19 rel 


25. : $. $. 0 root 


Die Tabelle ist vertikal und horizontal lesbar: In der Vertikalen ist die Wortse- 
quenz abgebildet. In der zweiten Spalte befindet sich der ursprüngliche Text, also 
die Wortformen, allerdings bereits in einer tokenisierten Version. Das bedeutet, 
dass der Parser den Satz in „Wörter“, also Tokens zerlegt hat. Jede Zeile enthält 
ein Token. Nun befinden sich in horizontaler Richtung in den weiteren Spalten 
Annotationen zu den Tokens. So wird in der dritten Spalte (sofern erkannt) das 
Lemma aufgeführt, danach Wortartklassen in zwei Versionen, Numerus, Kasus 
und Genus-Informationen und in den letzten zwei Spalten Angaben zu den 
Dependenzrelationen: Die letzte Spalte nennt den Relationstyp, die dazugehö- 
rige Nummer in der zweitletzten Spalte nennt die Token-Nummer, auf die sich die 
Funktion bezieht. Diese Angaben sind dazu prädestiniert, als Graph ausgegeben 
zu werden, damit die Abhängigkeiten synoptisch sichtbar werden, was die grafi- 
sche Ausgabe des Parsers ermöglicht (vgl. Abbildung 49). 


Auschnitt 


ganzer Graph 


= 


' ' 
Blick auf weniger offensichtliche Visualisierungen ‘ die auf ihr beruhen 


| Po. ---- - - -- 


Blick auf wenige offensichtlich Visualisierung F die a ihr beruhen 
NN APPR PIAT ADJA NN $, PRELS APPR PPER VVFIN 

c|Nom|Sg Acc IL Pos|_|Acc|_|_| Fem|Acc|PI _  Fem|Nom|PI Dat 3|Sg|Fem|Dat 3|PI|Pres|_ 
15 16 17 18 19 20 21 22 23 24 


Abb. 49: Grafische Ausgabe des Dependenzparsers ParZu (Sennrich et al. 2009) 
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Die Graph-Darstellung benutzt die diagrammatische Grundfigur desselben 

Namens und wird in Abschnitt 5.5 noch genauer zu diskutieren sein. Zunächst 

möchte ich aber argumentieren, dass die in Tabelle 9 gezeigte Ausgabe des 

Dependenzparsers von der diagrammatischen Grundfigur der Partitur abgelei- 

tet ist, wobei sie aber gegenüber der gängigen Vorstellung einer Partitur um 90 

Grad gedreht dargestellt ist. Während das genannte Beispiel mit den acht Spalten 

relativ komplex ist, existieren auch einfachere Fälle von vertikalisiertem Text, die 

weniger Annotationsebenen verwenden. Wichtig ist zudem, dass selbstredend 
nicht nur Ausgaben von computerlinguistischen Werkzeugen in diese Kategorie 
fallen, sondern auch manuell erstellter vertikalisierter Text dazu gehört. 

Den vertikalisierten Text könnte man nun auch als Liste oder Tabelle auf- 
fassen. Die Ähnlichkeit zu einer Partitur besteht jedoch durch folgende Eigen- 
schaften: 

- Die vertikale Ordnung ist festgelegt: Sie folgt der Sequenzialität des Textes. 
Es ist nicht sinnvoll, die Liste nach anderen Kriterien zu ordnen, sondern 
sie lebt davon, genau in dieser Ordnung gelesen oder verarbeitet zu werden, 
genauso wenig man das auf horizontaler Achse mit einer musikalischen Par- 
titur machen würde. 

- Auf horizontaler Achse ist die Alignierung, also exakte Übereinstimmung 
der Ebenen absolut zentral, denn sie sorgt dafür, dass die Simultaneität der 
Ebenen sichtbar wird. Bei der klassischen Partitur wird diese Aufgabe ent- 
sprechend über die vertikale Achse gelöst. 

-  Diskussionswürdig bleibt hingegen ein drittes wichtiges Kriterium für eine 
Partitur, nämlich die Gleichwertigkeit der ‚Stimmen‘. Man kann mit Recht 
argumentieren, dass die eine Ebene, nämlich die der Wortformen, sozusagen 
eine Leitstimme ist und alle anderen bloß Annotationen dazu. Der Annota- 
tionsbegriff ist ja schließlich auch der Begriff, den man normalerweise für 
solche Konstrukte verwenden würde. Allerdings gibt es einen meines Erach- 
tens gewichtigen Einwand: Auch die Ebene der Wortformen ist ja nicht der ori- 
ginale Text, sondern bereits eine verarbeitete, nämlich tokenisierte und vom 
originalen Text abgeleitete Ebene. Sie ist völlig gleichwertig gegenüber den 
anderen Ebenen. Der originale Text ist aber im vertikalisierten Text eigentlich 
gar nicht mehr sichtbar und kann höchstens rekonstruiert werden.*! Daher 
scheint mir der vertikalisierte Text sehr deutlich eine diagrammatische Ablei- 


41 Allerdings ist die Rekonstruktion meist nicht exakt möglich, da beim Tokenisieren beispiels- 
weise Spatien vereinfacht und alle auf das einfache Leerzeichen vereinheitlicht werden. Mit- 
unter werden auch andere Zeichenvarianten vereinheitlicht, beispielsweise Anführungszeichen. 
Völlig ignoriert werden zudem meist alle Formen von Formatierung im Originaltext. 
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tung des Originaltextes zu sein, die in sich gleichwertige ‚Stimmen‘ organi- 
siert und insbesondere ihre Simultaneitat aligniert. 


Das Beispiel des vertikalisierten Textes oben ist insofern ein Spezialfall von Par- 
titur, als dass sich die Tokenisierung der Wortformenspalte über alle Ebenen 
hinwegzieht und keine, über diese Einteilung hinaus gehenden Sequenzen auf- 
geführt sind. So als ob — übertragen auf eine musikalische Partitur - pro Takt 
jeweils immer eine gleichwertige Note (aber auf unterschiedlicher Tonhöhe) 
stehen würde. Das spricht aber nicht gegen die Grundidee der Partitur. Zudem 
ist vertikalisierter Text auch in der Form möglich, dass auf einzelnen Ebenen 
bestimmte Attribute mehrere Tokens überspannen. Mit diesem Fall wird dann die 
Differenz zur Tabelle noch deutlicher, da dies zwar dort ebenfalls möglich ist, 
aber eigentlich der Grundidee der Tabelle widerspricht und z. B. bei Sortieraufga- 
ben auch sofort zu Problemen führt. 


ks lang«"de” n«"a2-s87"> 

Unter APPR unter a2-s87-w1 

den ART d a2-587-w2 

zahllosen ADJA zahllos a2-s87-w3 
Bergen NN Berg  a2-s87-w4 

vor APPR vor a2-587-w5 

unsern PPOSAT unser 32-587-w6 

Augen NN Auge a2-587-w7 

ragte WFIN empor+ragen a2-s87-w8 

der POS d a2-587-w9 

ferne ADV ferne a2-s87-wl@ 

«mountain id="g_38" stid="g23" level="geo"> 
Mont NE Mont a2-s87-w11 

Blanc NE Blanc a2-s87-w12 

</mountain> 

über APPR über a2-587-w13 

die ART d a2-587-wi14 

andern PIS ander a2-s87-w15 

empor PTKVZ empor a2-587-w16 

; $. ; a2-s87-wi7 

</s> 
<s lang="de” n="a2-588"> 

näher ADID nah a2-s88-w1 

bei APPR bei a2-s88-w2 

uns PRF wir a2-s88-w3 

thronten WFIN thronen a2-s88-w4 

«mountain id="g 39" stide"s7302518" level="geo"> 
Schreckhorn NE Schreckhorn a2-588-w5 
</mountain> 

A $, , a2-s88-w6 

<mountain id="g 48" stid="s7296734" level="geo"> 
Wetterhorn NE Wetterhorn a2-s88-w7 
</mountain> 

und KON und a2-sB8-w8 

<mountain id="g 41” stid="s7398@60" level="geo"> 
Jungfrau NE Jungfrau a2-588-w9 
</mountain> 

, % » a2-s88-w10 

dem PREIS d a2-s88-wil 

Scheine NN Schein a2-s88-w12 

nach APPO nach a2-s88-w13 

weniger ADV weniger a2-s88-w14 


A SE rauen Abb. 50: Beispiel für eine Mischung aus vertikalisier- 
Standort WM Standort a2-s60-x8 tem Text und XML-Annotation im Text+Berg-Korpus 
Feige (Bubenhofer et al. 2015b) 


Bei in der Korpuslinguistik üblichen Varianten von vertikalisiertem Text wird die 
oben gezeigte Reinform oft ergänzt durch XML-Annotationen. Ein Beispiel dafür 
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zeigt Abbildung 50. Der vertikalisierte Text mit den Spalten Token, Wortartklasse, 
Lemma, Wort-ID wird durch mitunter mehrere Tokens umfassende XML-Tags 
ergänzt, die automatisch erkannte Bergnamen markieren. Eine Hierarchieebene 
darüber werden mit <s> und </s> zudem Sätze markiert. Natürlich wären belie- 
bige weitere XML-Annotationen denkbar. 

Die Auszeichnungsssprache XML, wie auch HTML, beides Abkömmlinge der 
generelleren Sprache SGML (Standard Generalized Markup Language), ist eigent- 
lich in einer Baumstruktur organisiert: Es gibt einen Wurzelknoten, von dem 
abzweigend beliebige Elemente definiert werden können, die sich weiter verzwei- 
gen. Daher ist eine XML-Struktur zunächst nicht partiturartig, sondern bedient 
sich der diagrammatischen Grundfigur des gerichteten Graphen (vgl. Abschnitt 
5.5). In Abbildung 51 ist ein einfaches Beispiel einer solchen Struktur abgebildet. 
Der Wurzelknoten <xml> enthält einen (oder beliebig viele) <text>-Knoten, diese 
wiederum enthalten <title>, <author> und <body>-Knoten etc. Man könnte leicht 
einen Graphen zeichnen, der die Struktur vollständig repräsentiert. 


<xml> 
<text> 
<title>Das ist ein Titel</title> 
<author>Noah Bubenhofer</author> 
<body> 
Hier kommt ein ganzer Text, <emph>das hier ist 
hervorgehoben</emph>. 
</body> 
</text> 
</xml> 


Abb. 51: Beispiel für eine simple XML-Struktur 


Trotzdem wohnt dieser Struktur auch etwas partiturartiges inne, denn auch in ihr 
wird die Simultaneität bestimmter Elemente ausgedrückt, ähnlich der Stimmen 
in einem Gespräch. So ist der Teilsatz „das hier ist hervorgehoben“ gleichzeitig 
annotiert mit der Information, dass er hervorgehoben ist; „Noah Bubenhofer“ ist 
gleichzeitig mit der Information versehen, dass es sich um den Autor handelt. 
Zudem bilden die Elemente eine Sequenzialität ab, da sie Text annotieren. Aller- 
dings ist Sequenzialität grundsätzlich keine für eine XML-Struktur bedeutende 
Eigenschaft. Würde es sich nicht um Text handeln, der ausgezeichnet wird, 
sondern um beliebige andere Daten, wäre es mitunter völligirrelevant, in welcher 
Reihenfolge die Elemente genannt würden, so lange sie am richtigen Knoten des 
hierarchischen Baumes festgemacht sind. 
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Mit XML ausgezeichneter Text bringt jedoch eine deutliche Sequenzialisierung 
in die Struktur ein. Beim vertikalisierten Text oben (vgl. Abbildung 50) ist das 
sehr deutlich der Fall. Je größer die Bedeutung der Sequenzialisierung ist, desto 
stärker nähert sich die Struktur der diagrammatischen Grundfigur der Partitur an. 

Während XML (zusammen mit anderen Datenformaten wie JSON, Datenban- 
ken etc.) für viele Zwecke eingesetzt wird, bereitet die Codierung von sprachli- 
chen Daten immer wieder Probleme. So sind in XML beispielsweise sich kreu- 
zende XML-Elemente nicht erlaubt, da sie nicht mehr in einer Baumstruktur 
abgebildet werden können: 


<absatz>Das ist <kursiv>Text, der <fett>nur dazu</kursiv> da ist, ein 
</fett> Beispiel zu geben.</absatz> 


Die kreuzende Struktur von <kursiv> und <fett> ist nach XML-Standard nicht 
wohlgeformt. In einer partiturähnlichen Darstellung wäre es kein Problem, den 
Satz so auszuzeichnen: 


T: Das ist Text, der nur dazu da ist, ein Beispiel zu geben. 
Ke °  . | VSSSreressssssess- 
F à peepee enjana aana 


Oder, ganz vertraut: 
Das ist Text, der nur dazu da ist, ein Beispiel zu geben. 


Die sogenannte „Standoff-Annotation“ ist dann in XML auch eine Möglichkeit, 
solche Probleme zu lösen (vgl. dazu und zu weiteren Problemen im Zusammen- 
hang mit XML und Textannotation Bański 2010; Bański/Przepiórkowski 2010). 
Sie beruht auf dem Prinzip, in separaten Dateien (sozusagen ,Stimmen‘) über 
Marker (Wort-IDs, Bytepositionen o.ä.) im Ausgangstext Annotationen hinzu- 
zufügen. Man vermerkt dann beispielsweise, dass von Position X bis Position Y 
im Ausgangstext die Eigenschaft a gilt. Damit nähert sich die rein hierarchische 
XML-Struktur nochmals starker der diagrammatischen Grundfigur Partitur an. 

Es ist nicht von ungefähr, dass die diagrammatische Grundfigur der Partitur 
so wichtig ist für die Repräsentation von Sprache. Die Eigenschaften der Sequen- 
zialität und Simultaneität hat sie mit Musik gemein. Schon im 9. Jahrhundert 
wurden für die synoptische Darstellung von Musik Partiturdarstellungen erfun- 
den und seit dem Interesse der Linguistik für gesprochene Sprache und seit dem 
Bedürfnis, Text digital zu repräsentieren, fällt diese Idee auch in der Linguistik 
auf fruchtbaren Boden. 
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Sprache und Musik sind allerdings nicht die einzigen Phänomene, zu der die dia- 
grammatische Grundfigur der Partitur passt. Interessant in diesem Zusammen- 
hang sind nämlich die Entwicklungen in den Bereichen Informationsmanage- 
ment und Informatik, die durch bedeutende Veränderungen der Strukturierung 
des Webs zu beobachten sind. Denn das Web funktioniert seit einigen Jahren 
immer stärker als „real-time web“ voller Datenströme: 


The way we have traditionally thought about the Internet has been in terms of pages, but 
we are about to see this changing to the concept of ‚streams‘. In essence, the change rep- 
resents a move from a notion of information retrieval, where a user would attend to a par- 
ticular machine to extract data as and when it was required, to an ecology of data streams 
that forms an intensive information-rich computational environment. This notion of living 
within streams of data is predicated on the use of technical devices that allow us to manage 
and rely on the streaming feeds. (Berry 2011, 143) 


Offensichtlich sind diese „Streams“, wenn man sich populäre Webangebote 
ansieht, die mit dem Begriff „Webseite“ nur unzureichend beschrieben werden 
können: Blogs, Microblogging-Systeme wie Twitter oder Flickr, soziale Netzwerke 
wie Facebook, YouTube-Kanäle, Instant-Messaging-Systeme wie WhatsApp, aber 
auch Online-Nachrichtenportale etc. Informationen und Kommunikation werden 
als polyphone Ströme dargeboten und konsumiert. Diese Dienste gehen mit 
Veränderungen der Benutzerinterfaces aber auch der Geräte einher, wobei das 
Smartphone als ständiger Begleiter treibender Faktor dahinter war (Berry 2011, 
149). Das Streaming Web ist auf der einen Seite eine Goldgrube für die beinahe 
lückenlose Überwachung sozialen Handelns, auf der anderen Seite aber auch 
eine große technologische Herausforderung, da riesige Datenmengen entstehen, 
die verarbeitet werden müssen, um sie nutzen zu können. Und um diese paralle- 
len Streams auf Endgeräten darreichen zu können, müssen dafür geeignete Inter- 
faces und vor allem Visualisierungsstrategien erfunden werden: 


[...] I can only note the importance of the visual mediation of this data and its highly aesthet- 
icised content but clearly with the amount of data available the skills of a visual rhetoric will 
become increasingly important to render the patterns in the data meaningful. (Berry 2011, 155) 


Allein wenn man beriicksichtigt, welche Datenformate zur Codierung dieser 
Inhalte benutzt werden, wird deutlich, dass die klassischen Mittel der Informatik, 
die geprägt ist von Tabellen und Datenbanken, an die Grenzen stoßen. Formate 
wie XML oder JSON, aber auch die relationale Datenbank, die lange als univer- 
selle Lösungen propagiert wurden, eignen sich für Streaming-Formate weniger 
gut, was ja bereits die Ausführungen oben zu XML zur Codierung von sprachli- 
chen Daten deutlich gemacht haben. 
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Der Grund hinter der Komplexität von Streaming-Formaten liegt eben darin, dass 
Ströme, insbesondere polyphone Ströme, auf der diagrammatischen Grundfigur 
der Partitur beruhen, und nicht der Liste oder Tabelle, auch nicht den Karten oder 
den Vektoren und Graphen (wie in den Abschnitten 5.4 und 5.5 noch zu sehen 
sein wird). Es ist einleuchtend, dass die Musik-Partitur nicht Vorbild für neue 
Interfaces von Web 2.0 sein kann. Aber die abstraktere Idee der Grundfigur ist 
durchaus bereits bei bestehenden Interfaces sichtbar und könnte Pate für weiter- 
gehende Entwicklungen stehen. 


5.4 Vektoren 


In Abschnitt 4.1 zur Verdatung von Sprache habe ich bereits gezeigt, wie ein Kol- 
lokationsprofil zu einem Lemma als Vektor aufgefasst werden kann. Ein Zahlen- 
vektor {0, 0, 1, 0, 1, 1, 0, O, 0, 1} würde beispielsweise für zehn Lemmata angeben, 
ob sie in einem bestimmten Korpus mit dem Basislemma kollokieren (1) oder 
nicht (0). Natürlich würde man bei einem realen Beispiel mit viel mehr Lemmata 
arbeiten und diese zudem gewichten, also nicht nur O und 1 codieren, sondern 
ausdrücken, wie häufig sie kollokieren oder wie stark die Assoziation ist. 

Ein anderes Beispiel für die Anwendung eines Zahlenvektors ist der Vergleich 
von Texten. Nehmen wir an, wir würden für acht Texte A-H jeweils die Frequenz 
von zwei Lexemen X und Y zählen, weil wir davon ausgehen, dass sich die Texte 
in der Verwendung dieser beiden Lexeme unterscheiden. Dadurch entsteht eine 
Liste folgender Art: 


Tab. 9: Liste mit Fantasiefrequenzen der Lexeme X und Y 


Text fX fY 


A 15 28 
B 25 11 
C 27 9 
D 30 10 
E 30 30 
F 31 10 
G 28 28 


H 27 30 
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Für jeden Text werden also die Frequenzen der Lemma-Types X und Y gemessen. 
Der Vektor für A wäre demnach {15, 28}, für B = {25, 11} etc. Diese Tabelle kann 
leicht in einem Diagramm dargestellt werden, wie Abbildung 52 zeigt. Für jeden 
Text wird ein Punkt in Diagramm eingezeichnet, dessen Position durch die Fre- 
quenzen auf den Achsen X und Y definiert ist. 
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Abb. 52: Streudiagramm Fantasiefrequenzen fiir X und Y von acht Objekten 


Diagrammatisch operierend wird nun jeder Punkt als Vektor definiert, der aus- 
gehend vom Nullpunkt zur jeweiligen Position zeigt. Fiir die Texte A, B und C 
sind die Vektoren in der Abbildung zur Illustration eingefiigt. Indem die Punkte 
als Vektoren aufgefasst werden, können nun geometrische Operationen durchge- 
führt werden. Um beispielsweise die Distanz zwischen den Punkten zu bemessen, 
können die Winkel, die die Vektoren aufmachen, gemessen werden (Kosinus-Dis- 
tanz). Oder aber die direkte Distanz zwischen den Punkten wird gemessen (euk- 
lidische Distanz). 

Nun kann man beliebig viele weitere Lemmata hinzunehmen, um die Texte 
zu klassifizieren. Dabei erhöht sich bloß die Zahl der Dimensionen im Diagramm. 
Bei drei Dimensionen (Frequenzen dreier Lemmata) ist ein solches Diagramm mit 
einer z-Achse im Raum noch darstellbar, bei mehr Dimensionen nicht mehr. Die 
geometrischen Kalkulationen bleiben aber nach wie vor möglich. Es wird also 
dank mathematischer Mittel in einem Raum operiert, der nicht mehr als Dia- 
gramm darstellbar, als Grundfigur in der zwei- oder dreidimensionalen Fassung 
aber noch präsent ist. 
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Man kann die Transformation von sequenziellem Text qua Distributionsverhalten 
von linguistischen Einheiten (Lemmata, aber auch beliebige andere Einheiten) in 
den Vektorraum nicht genug wichtig einschätzen: Sie eröffnet ein großes Arsenal 
weiterer diagrammatischer Operationen, die neue Sichten auf die Daten generie- 
ren: 


The concept of a geometric feature space allows us to take the most basic method of human- 
ities - a comparision - and extend it to big cultural data. In the same time, it allows us (or 
forces us, if you prefer) to quantify the concept of difference. (Manovich 2015, 26) 


Die Operationalisierung von Differenz ist nur eine Méglichkeit; in Kombination 
mit Parallelität ergibt sich beispielsweise folgende Möglichkeit: Wenn nun statt 
Texte wieder Kollokationsprofile in einen Vektorraum überführt werden (wie in 
Abschnitt 4.1), bewegen wir uns im Feld der sogenannten „Word Embeddings“ 
(Mikolov et al. 2013). Auf der Basis eines großen Korpus werden die „Embed- 
dings“, also das distributionelle Verhalten (Kollokationsprofile) aller Lexeme 
berechnet und im Vektorraum positioniert. Nun kann beispielsweise folgende 
Frage gestellt werden: 


Italien : Rom = Frankreich : ? 


Um das Fragezeichen auflösen zu können, wird folgende Operation vorgenom- 
men: Für die Lexeme „Italien“ und „Rom“ wird der Vektor berechnet, um von 
der Position „Italien“ nach „Rom“ zu kommen. Nun nimmt man den Vektor für 
„Frankreich“ und addiert dazu den vorher berechneten Vektor zwischen „Italien“ 
und „Rom“. Der sich daraus ergebende neue Vektor wird ziemlich genau auf 
„Paris“ verweisen. 

Linguistisch ist dies mit kontextualistischen Ansätzen wie bei Firth (1957) 
gut erklärbar, denn die Kollokationsprofile von „Rom“ und „Paris“ werden sich 
ähneln, insbesondere in Relation zu jeweils „Italien“ bzw. „Frankreich“. Wenn 
man sozusagen die „Italien“-spezifischen Kollokatoren von „Rom“ weg rechnet 
und dafür diejenigen von „Frankreich“ hinzurechnet, sollte man bei „Paris“ 
landen. Nach dem gleichen Prinzip wird das Verfahren auch sprachiibergreifend 
eingesetzt, indem ein Parallelkorpus, in dem Sätze mehrerer Sprachen auf Satz- 
ebene aligniert sind, als Trainingskorpus dient. Die je Sprache separat gelernten 
Vektorräume werden über die Alignierungsinformation in einen gemeinsamen 
Vektorraum überführt. So ist es möglich, ausgehend von einem Lexem in der 
einen Sprache Entsprechungen in den anderen zu finden - alleine über die Ähn- 
lichkeit des Distributionsverhaltens (Luong et al. 2015; Bérard et al. 2016; vgl. für 
eine Anwendung im diskurslinguistischen Kontext Bubenhofer/Rossi 2019). 
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Dank der Auffassung des Distributionsverhaltens als Position in einem Vektor- 
raum gibt es fiir die linguistisch postulierte Distributionssemantik eine geome- 
trische Operationalisierung. Und auch hier ist wichtig zu verstehen, dass die 
geometrischen Operationen gleichzeitig diagrammatische Operationen sind, die 
mit einer Jahrtausende alten Tradition des geometrischen Denkens in n-dimensi- 
onalen Räumen einher geht. 

Hinter vielen Diagrammen, die zum Standardrepertoire der Balken-, Linien- 
und Kreisdiagrammen gehören, steckt die diagrammatische Grundfigur des 
Vektors. Ein einfaches Balkendiagramm visualisiert eine Reihe von eindimensio- 
nale Vektoren etwa der Form w = {10}, m = {7} etc. Liniendiagramme stellen einen 
oder mehrere Vektoren als Zahlenreihe dar und das oben genannte Beispiel zur 
Klassifikation von Texten stellt ein Streudiagramm dar, das zweidimensionale 
Vektoren repräsentiert. Mit den mehrdimensionalen Vektoren wird aber deutlich, 
dass diese diagrammatische Grundfigur zwar oft grafisch manifest ist, doch in 
einen nicht-grafischen Raum projiziert werden kann und dort nach den gleichen 
Prinzipien funktioniert. 


5.5 Graphen 
5.5.1 Graph als grafische Form 


Der Begriff „Graph“ ist eine eher technische Bezeichnung für Diagrammformen, 
die man auch „Baum“ oder „Netz“ nennt. Der gemeinsame Nenner all dieser 
Erscheinungsformen ist das Vorhandensein von Knoten (auch „Ecken“ / „nodes“) 
und Verbindungen dazwischen („Kanten“ / „edges“). An jedem Knoten gehen 
eine oder beliebig viele Linien weg und landen wieder bei Knoten. Die Knoten 
und/oder die Kanten müssen natürlich nicht grafisch realisiert sein, so kann eine 
Graphstruktur auch beispielsweise rein mit textuellen Mitteln erzeugt werden: 

- A 


- B 
- a 
- b 
- 1 
2 
- 3 
= EE 
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Graphen können grundsätzlich gerichtet oder ungerichtet sein. Gerichtete 
Graphen sind hierarchisch organisiert und legen eine Leserichtung nahe. Ein 
prototypisches Beispiel für einen gerichteten Graph sind Baumstrukturen. Der 
Textgraph oben ist deutlich gerichtet im Sinne einer hierarchischen Gliederung;”? 
die mit Majuskeln gekennzeichneten Knoten stehen auf der obersten Hierarchie- 
ebene. Sie sind sogenannte „Wurzelknoten“ ohne hierarchisch darüber stehende 
Knoten. Die hierarchische Struktur wird normalerweise mit Verwandtschaftster- 
minologie beschrieben: A, B und C sind Elternknoten von a, b und c. A, B und C 
sind zueinander jeweils Geschwister (wie das auch a, b, und c sowie 1, 2 und 3 
untereinander sind). a, b und c sind Kindknoten von B, wie auch 1, 2 und 3 von 
b. Bei gerichteten Graphen besitzt ein Knoten normalerweise nur einen direkten 
Vorfahren und mehrere direkte Nachkommen. Der Binärbaum ist ein Spezialfall 
von gerichteten Graphen, wo jeder Knoten jeweils nur einen direkten Vorkommen 
und zwei (oder keine) direkten Nachkommen hat. Obwohl bei gerichtete Graphen 
oft jeder Knoten nur einen direkten Vorfahren hat, ist das nicht Bedingung fiir 
Gerichtetheit. 

Ungerichtete Graphen codieren keine Hierarchie, zumindest nicht systema- 
tisch entlang einer vertikalen oder horizontalen Achse, und werden dadurch als 
Netz wahrgenommen. Jeder Knoten hat beliebig viele Verbindungen zu anderen 
Knoten und es ist nicht zwingend bestimmbar, welche dieser Knoten Vorfahren 
oder Nachkommen waren. 

Graphen sind in vielen Erscheinungsformen bekannt: Bäume als Stamm- 
bäume, Organigramme, Wissensgliederungen und Systematiken, Suchbäume 
in der Informatik, Syntaxbäume etc.; Netze zur Darstellung von sozialen Bezie- 
hungen, technischen Verknüpfungen, Wegen etc. Manuel Lima zeigt in seinem 
„Book of Trees“ (Lima 2014) eine reiche Palette von Graphen mit einer langen 
Tradition. Bei Ramses I werden z.B. bereits 1290 v. Chr. Brettspiele beschrieben, 
die auf einem gezeichneten Graph beruhen, um Standpositionen und mögliche 
Bewegungen von Spielfiguren zu definieren, etwa wie man es vom Mühlespiel 
kennt (Kruja et al. 2002). 

Wie breit die Palette von Erscheinungsformen graphartiger Diagramme ist, 
wird deutlich, wenn man Limas Kategorisierung folgt (Lima 2014): 


42 Wenn man es genau nimmt, ist der Textgraph sogar zweifach gerichtet: Einmal sozusagen 
graphintern, daB ein Elternknoten von a, b und cist, und 1, 2 und 3 wiederum Kindknoten von b 
etc. Die Eingliederung des Graphen in einen Text führt aber auch dazu, dass er als sequenzielle 
Liste gelesen wird, wonach A hierarchisch gesehen vor B und dieses vor C steht. Es kommt hier 
also zu einem Widerstreit zweier diagrammatischer Grundfiguren und je nach Kontext wird die 
eine oder andere Lesart dominanter sein. 
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- Figurative Bäume: Natürlichen Bäumen nachempfundene Zeichnungen. 

- Vertikale Bäume: Von den figurativen Bäumen abstrahierte gerichtete 
Graphen mit vertikaler Ausrichtung. 

- Horizontale Bäume: Wie vertikale Bäume, aber mit horizontaler Ausrichtung. 

- Multidirektionale Bäume: Ungerichtete Graphen mit wenig deutlicher Hie- 
rarchie, zumindest nicht einer horizontalen oder vertikalen Achse entlang. 

- Radiale Bäume: Gerichtete Graphen, die radial ausgerichtet sind (Kindkno- 
ten reihen sich auf einem Kreis um den Elternknoten herum auf). 

- Hyperbolische Bäume: Untergruppe der radialen Bäume, die aber die radiale 
Ausrichtung zugunsten der Betonung bestimmter Knoten verzerren. 

-  Rechteckige Baumkarten (Treemaps): Klassische Form der Baumkarten (oder 
Kacheldiagrammen / Treemaps), bei der ineinander verschachtelte Recht- 
ecke die Hierarchie des Baumes darstellen. 

-  Voronoi-Baumkarten: Abwandlung der rechteckigen Treemaps, bei der statt 
Rechtecke polygonale Zellen verwendet werden, die ihre Form besser anpas- 
sen können. 

- Zirkuläre Baumkarten: Ebenfalls eine Abwandlung der rechteckigen Tree- 
maps, bei der Kreise verwendet werden. 

—  Sunbursts / radiale Baumkarten: Die Kombination von radialem Baum und 
Baumkarte, also radial angeordneten Flächen. 

-  „Eiszapfen“-Bäume (,,icicle trees“): Treemap / Kacheldiagramm in einer hie- 
rarchischen Ausrichtung. 


Vgl. dazu Abbildung 53, die die Typen grafisch abbildet. 

Entscheidend für die Entwicklung der diagrammatischen Grundfigur Graph 
war der Übergang von der figürlichen, zunächst auch nicht-metaphorischen Dar- 
stellung des Baumes zu abstrakteren Formen. Bei Platon und Aristoteles (4. Jh. 
v. Chr.) findet sich mit der Dihairesis eine Methode der Begriffsbestimmung in 
der antiken Logik, die dann spätestens bei Porphyrios im 3. Jh. zumindest die 
gedankliche Form einer abstrakten Anwendung der Baummetapher annimmt. Im 
6. Jh. findet Boéthius mit dem Porphyrianischen Baum eine grafische Darstellung 
des Begriffssystems, was dann zu vielen weiteren Visualisierungen führt (Lima 
2014, 27). Ein Beispiel dafür ist im 16. Jh. Christophe de Savigny mit seinen enzy- 
klopädischen Wissenstafeln (vgl. Abschnitt 2.3.1). 


5.5.2 Graph als Baum 


Die Taxonomie von Lima ist grafisch motiviert. Wenn man aber nach den Bedeu- 
tungen von Graphen fragt, verbergen sich hinter der gleichen grafischen Form 
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Abb. 53: Klassifikation von Baumgraphen bei Lima (2014, 4-5) 
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sehr unterschiedliche diagrammatische Typen. Dies wird deutlich, wenn wir uns 
die Verwendung von Graphen in der Linguistik vor Augen führen und uns dort 
wiederum zunächst auf „Bäume“, also gerichtete Graphen, beschränken. 

Harleman Stewart (1976, 38) unterscheidet in der Linguistik vier verschie- 
dene Bedeutungen, die Bäume einnehmen: genetische Bäume in der Sprachge 
schichte/Sprachtypologie („genesis“), Taxonomien, Komponentenanalyse und 
Konstituentenanalyse. 

Auf Beispiele aus der Sprachgeschichte bzw. zur Sprachtypologie bin ich in 
Abschnitt 2.3.3 schon kurz zu sprechen gekommen. Bekannt sind in der Lingu- 
istik zudem August Schleichers Skizzen zum Sprachenbaum, der einerseits eine 
entwicklungsgeschichtliche als auch klassifikatorische Bedeutung postuliert. 
Entsprechungen dazu finden sich in der biologischen Evolutionstheorie bei 
Darwin. Die vertikale Achse solcher Bäume wird zeitlich gelesen, Finheiten auf 
der selben Höhe müssen jedoch nicht zwingend zeitgleich erscheinen. Holistisch 
betrachtet repräsentiert der Baum eine phylogenetische Bedeutung (Harleman 
Stewart 1976, 15). 

Diese Verwendung unterscheidet sich von taxonomischen Verwendungen, 
die wohl zu den ältesten Verwendungen von Graphstrukturen überhaupt gehören, 
wenn man an die Begriffsbestimmungen in der klassischen Antike denkt. Solche 
Bäume werden in der Linguistik, genau so wie in anderen Disziplinen, häufig für 
Begriffsbestimmungen eingesetzt. Ein Beispiel ist die Unterteilung von Zeichen 
in Signifiant und Signifie. Die vertikale Achse wird als Paradigma gelesen, das 
die Einträge „Zeichen“ und ,,Signifikant/Signifié“ enthält. Auf horizontaler Achse 
handelt es sich allerdings um eine syntagmatische Beziehung: „Signifikant“ oder 
„Signifie“. Auf vertikaler Achse findet eine fortlaufende Differenzierung der 
Begriffe statt und keine zwei Begriffe auf der gleichen Stufe enthalten gemein- 
same Objekte ihrer Extension (Harleman Stewart 1976, 20). Harleman Stewart 
macht jedoch bereits auf die nicht immer konsequenten Verwendungen von taxo- 
nomisch wirkenden Bäumen in der Linguistik aufmerksam, etwa am Beispiel der 
Semantik: 


[...] because linguistic taxonomy allows overlapping feature-classes, the desired relations 
of implication that hold among features are not, as is often held, to be automatically and 
unambiguously inferred. The contention is that reading up the tree reflects logical implica- 
tion. Yet this is true only for the left-hand branches in a semantic feature hierarchy like the 
one below: [im Original folgt Abb. 54] (Harleman Stewart 1976, 26) 
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(+Plant] (-Plant] 


(*Animate] (-Animate] 


(+Human) (-Human] 


(Bever and Rosenbaum 1970:6) 


Abb. 54: Baumdiagramm von Harleman Stewart (1976, 26) 


Der Baum kann von unten nach oben so gelesen werden: [+Human] impliziert 
[+Animate] impliziert [-Plant]. Aber wenn man Gleiches mit den rechten Ästen 
versucht, gelingt das nicht: [-Human] impliziert nicht zwingend [+Animate] und 
[-Animate] nicht [-Plant] (Harleman Stewart 1976, 27). Dies ist der Fall, weil es sich 
um überlappende Klassen handelt.” 

Natürlich gibt es genügend begriffsdefinitorische Anwendungen in der 
Linguistik, die taxonomisch sind. Im Bereich der Semantik verweist Harleman 
Stewart aber auf die Tradition der Komponentenanalyse, die Baumdarstellungen 
verwendet, jedoch sie klar nicht taxonomisch liest. Das ist der Fall, wenn die glei- 
chen Merkmale mehrfach im Baum vorkommen können. 

Abbildung 55 (s. u., S. 176) zeigt ein Beispiel für eine komponentensemanti- 
sche Definition von engl. „bachelor“ als Baum (zit. nach Harleman Stewart 1976, 
30). Die Merkmalsausprägungen von „Human“, „Male“ und „Adult“ treten mehr- 
fach auf und haben nicht taxonomisch-definierende Funktion, sondern die Funk- 
tion eines, wie Harleman Stewart sagt, „Keys“ (Schlüssels): 


Keys, like taxonomic trees, construe the vertical dimension as conceptual space, within 
which a set is successively partitioned; keys, like taxonomic trees, construe the combina- 
tion of node and branch as set and subsets. But whereas taxonomic trees do not—or should 
not—allow overlapping classes, keys require them. A full key has them on every row; a tel- 
escoped key like the ones we have been looking at usually has at least some. (Harleman 
Stewart 1976, 32) 


43 Vgl. dazu auch die Unterscheidung von taxonomisch und meronymisch verstandenen Baum- 
diagrammen bei Keller (1995, 96) im Anschluss an Cruse (1986, 177ff.). 
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bachelor 


+Human -Human 
+Male -Male Pe 
+Adult -Adult +Adult -Adult +Adult -Adult a ya 
Wy Wo o3 WD, 


Abb. 55: Beispiel fiir einen Merkmalsbaum zur Bedeutung von „bachelor“; w, =Junggeselle, 
w, = angehender Ritter, w, = Bachelor-Student/in, w, =Jungtier; + bedeutet: Merkmal ist 
relevant; - bedeutet: Merkmal ist nicht relevant (Harleman Stewart 1976, 30) 


Was Harelman Stewart als „telescoped key“ bezeichnet, sind Baumdarstellun- 
gen, die nur für die semantische Bestimmung notwendigen Äste des Baumes dar- 
stellt. Alle Pfade, die ins Leere laufen, würden weggelassen. Liest man eine solche 
Baumdarstellung als „Key“, ist die Reihenfolge der Nennung der Merkmale nicht 
mehr relevant; der zu durchlaufende Pfad zeigt alleine an, welche Merkmalsaus- 
prägungen relevant sind. In dieser Lesart gleicht der Baum viel stärker der dia- 
grammatischen Grundfigur des Vektors. Die Bedeutung von „bachelor“ = Jungge- 
selle (w,) lautete dann bezüglich der Merkmale „Human“, „Male“, „Adult“: w, = 
{1, 1, 1} für die Bedeutung „akademischer Bachelor“ jedoch: w, = {1, 0, 0}. 

Schließlich nennt Harleman Stewart Anwendungen von Bäumen für die Kon- 
stituentenanalyse. Diese Darstellungen unterscheiden sich wiederum stark von 
allen anderen Bäumen: 


The relation expressed by combination of node and branch is thus to be read, not „becomes“ 
(as in genetic tree), nor „includes“ (as in a taxonomic tree), nor „is diveded into“ (asin a 
key), but simply „may be replaced by.“ This is the technique of immediate constituent anal- 
ysis itself: it is the process of substitution. (Harleman Stewart 1976, 36) 


Die Definition eines Satzes S kann also beispielsweise ersetzt werden durch die 
Beschreibung als Nominalphrase NP und Verbalphrase VP. Die Nominalphrase 
NP wird wiederum ersetzt durch Artikel Det und Nomen N, etc. Die Positionen der 
Knoten im Baum, bzw. damit deren Anbindung, ist relevant für die syntaktische 
Deutung. Eine NP direkt an den Satz S angebunden hat die Funktion eines Sub- 
jekts, eine NP an eine VP angebunden und diese an S hingegen diejenige eines 
Objekts. Die Funktionen ergeben sich aus dem Baum: „The figure entails this dif- 
ference: it is automatic“ (Harleman Stewart 1976, 37). 


Graphen — 177 


Harleman Stewart geht nicht auf Dependenzstrukturen ein, die auf den ersten 
Blick mit ihren Baumdarstellungen jenen der Konstituenten ähnlich sehen, jedoch 
wiederum eine andere Bedeutung haben: Die Kanten zeigen dort Abhängigkei- 
ten an und nicht Teil-Ganzes-Beziehungen wie bei den Konstituenten (Heringer 
1993, 298). Lucien Tesniére (1953) beschreibt dies sehr deutlich, indem er diese 
Verbindung, die „connexion“, gleich ganz an den Anfang seiner „Esquisse d’une 
syntaxe structurale“ nimmt: 


Soit la phrase Alfred chante, combien comporte-t-elle d’éléments ? 

Deux, répond-on communément : Alfred et chante. 

Un seul, hasardent parfois ceux qui sentent l’unit& de la phrase. 

Trois, dirons-nous, en tenant compte des deux réponses précédentes : 

1.- Alfred, 

2.- chante, 

3.- enfin et surtout, le lien qui unit Alfred et chante, et ans lequel nous n’aurions que deux 
idées indépendantes, sans rapport entre elles, mais non une pensée organisée. 

Nous donnerons à ce lien, sans lequel il wy aurait pas de phrase possible, le nom de 
connexion. (Tesniére 1953, 3; Hervorh. im Original) 


Tesniére argumentiert von Beginn weg sehr grafisch, indem die Erläuterungen 
zu den Schlüsselbegriffen Verbindung („connexion“), Nukleus („nucl&us“) und 
Stemma („stemma“) durch entsprechende Grafiken begleitet werden. Und zum 
Stemma-Begriff gesellt sich die in Abbildung 56 gezeigte Illustration dreier unter- 
schiedlich komplexer Stemmata - das lineare Stemma, die Bi- und Trifurkation. 


STEMMA LINÉAIRE Diasa = m a zau st u 
| 
Alfred chante. Alfred frappe Bernard. Alfred donne le livre à Charles. 


"as 
Alfred Bemard 


d 


ne 


à Charles 


le lıvre 


Abb. 56: Drei verschiedene Stemma-Formen, mit der Tesniére seine Dependenzsyntax einführt 
(Tesniére 1953, 3) 


Die Verbindung zwischen den Knoten ist nach Tesniére „l’äme de la phrase, 
son principe vital et organisateur“ und sichert die ,,fonction structurale“ (Tes- 
niére 1953, 3). Das Stemma als Ganzes stellt eine ,,représentation graphique de 
larchitecture des connexions“ dar - und dies einerseits mit einem „intérêt péda- 
gogique par son caractére simple, clair, concret et bref“ und andererseits einem 
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„intérêt scientifique par sa rigueur et sa souplesse“ (Tesniére 1953, 3). Mit Strenge 
und Flexibilität also charakterisiert Tesniére die gefundene grafische Form, was 
einmal auf die Universalität (flexible Einsetzbarkeit) der diagrammatischen 
Grundform verweist, die für Diagramme generell gilt und insbesondere bei der 
Anwendung für die Beschreibung einer syntaktischen Struktur bedeutend ist. 
Die Strenge verweist auf den von Harleman Stewart genannten Automatismus 
bei der Interpretation der Bäume, was vor einem diagrammatischen Hintergrund 
als Folge des Operierens mit dem Diagramm gefasst werden kann: Die syntakti- 
schen Funktionen sind aus der Baumdarstellung eindeutig ableitbar. (Und dies 
gilt selbstredend nicht nur für Dependenzbäume.) 

Die verschiedenen Ansätze der Generativen Grammatik wären ein weiteres 
prominentes Beispiel für die Bedeutung der Baumdiagramme als Denkzeug. Ich 
möchte hier nur kurz darauf eingehen; dass die Diagramme aber identitätsbil- 
dend für die verschiedenen Ansätze sind, zeigt ein Zitat von Christa Dürscheid in 
ihrer Einführung in Syntaxtheorien: 


Wie wir [...] gesehen haben, hat die Generative Grammatik in den vergangenen vier Jahr- 
zehnten eine beachtliche Entwicklung genommen. So verwundert es nicht, dass viele der 
generativen Untersuchungen heute nur noch wissenschaftsgeschichtlichen Wert haben. 
Wichtig ist, dass man sich bei der Lektüre stets klar macht, welcher theoretische Rahmen 
den Arbeiten zugrunde liegt. [...] Meist genügt [...] ein Blick auf die Strukturbäume, um sich 
Klarheit zu verschaffen: Werden Sätze als NP/VP-Strukturen dargestellt, so liegt der ältere 
Theoriestand zugrunde. Erfolgt eine CP/IP-Analyse bzw. CP/AgrP/TP-Analyse, so ist dies der 
neuere Theoriestand. (Dürscheid 2012, 151) 


Die von Noam Chomsky (1965) in seiner ältesten Fassung vorgeschlagenen Prä- 
missen eignen sich gut dazu, sie als Diagrammoperationen nachzuvollziehen, 
etwa wenn man an die Annahme einer Oberflächen- und Tiefenstruktur denkt 
und es darum geht, anhand eines Baumdiagramms zu zeigen, mit welchen Trans- 
formationsregeln die Oberflächenstrukturen desin der Tiefenstruktur angesiedel- 
ten Satzes erzeugt werden können. Chomskys Generative Grammatik ist freilich 
mehr als lediglich eine Syntaxtheorie. Sie ist die Grundlage einer weitergehenden 
Sprachtheorie, mit der Chomsky den aufklärerischen Impetus nach einem Men- 
schen in freier Selbstbestimmung verfolgt und sich dabei gegen einen pragma- 
tischen Sprachbegriff wendet, den er (fälschlicherweise) quasi gesellschaftlich- 
deterministisch interpretiert (Gardt 2012, 335-336).‘* Die Idee, aus Lexikon und 


44 Gardt weist auf Chomskys einseitige Lektüre der frühen Rationalisten wie Descartes und 
Leibniz hin: Chomsky sieht sie als Vorläufer der Idee, kommunikative Funktionen - die das freie 
und kreative Äußern von Gedanken behindern würden - von Sprache auszuklammern und statt- 
dessen Sprache als Menge von Wortinhalten und grammatischen Strukturen anzusehen, mit 
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parametrisierter Universalgrammatik eine unendliche Menge von Sätzen produ- 
zieren lassen zu können, wird durch das universelle grafische Set des Baumdia- 
gramms in Kombination mit den diagrammatischen Operationen gespiegelt.*? 

Dieser Drang nach Formalismus ist allen Syntaxtheorien gemein und wird 
damit begründet, so ein Evaluations- und Prognosesystem zur Verfügung zu 
haben: 


Wenn wir linguistische Beschreibungen formalisieren, können wir leichter erkennen, was 
genau eine Analyse bedeutet. Wir können feststellen, welche Vorhersagen sie macht und 
wir können alternative Analysen ausschließen. (Müller 2013, 3) 


Das Diagramm ist dabei ein wichtiger Teil der Formalisierung, weil es sowohl als 
didaktisches Anschauungsbeispiel der Formalisierung dient als auch identitäts- 
stiftend für ein Denkkollektiv wirkt. 


5.5.3 Graph als Netz 


Bäume haben heute jedoch anscheinend ausgedient. Diesen Eindruck gewinnt 
man, wenn man sich die Euphorie für Netzwerkdarstellungen vor Augen führt, 
die nicht nur die Wissenschaft erfasst hat. Netzdiagramme, also ungerichtete 
Graphen, scheinen aktuell das Mittel der Wahl zu sein, um komplexe Daten zu 
visualisieren. Dass es sich hierbei um ein Zeitgeistphänomen handelt, belegt die 
Tatsache, dass man einen Vortrag über Netze als sogenannten „TED-Talk“ halten 
kann, einer 6ffentlichkeitswirksamen und mitunter pathetisch wirkenden Kon- 
ferenzreihe, in der auch Manuel Lima auftrat: „A visual history of human know- 
ledge“ heißt sein an der TED2015 gehaltene Vortrag (Lima 2015). Lima behauptet: 


However, nowadays we are really facing new complex, intricate challenges that cannot be 
understood by simply employing a simple tree diagram. And a new metaphor is currently 


denen frei formuliert werden kann. Er übersieht - so Gardt — dabei jedoch die von den Ratio- 
nalisten gesehene kognitive Funktion, mit der sie den engen Zusammenhang von Sprache und 
Denken annehmen - einen Zusammenhang, der durchaus gerade als deterministisch ausgelegt 
werden kann (sprachliche Relativitätstheorie) und sogar eher „eine pragmatische Position mit 
ihrem offenen Systembegriff und dem Anerkennen sprachlicher Variation in Situation, Gruppe, 
Raum und Zeit der ‚freiheitlichen und kreativen Selbstverwirklichung der Sprecher‘ [...] größeren 
Raum einräumt“ (Gardt 2012, 338). 

45 Wobei auch die Frage zu diskutieren wäre, ob die jeweilige Theorie binäre Baumstrukturen 
bevorzugt, die zu „tiefen“ hierarchischen Bäumen führt, oder aber flache Strukturen; vgl. dazu 
Müller (2013, 367-369). 
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emerging, and it’s currently replacing the tree in visualizing various systems of knowledge. 
It’s really providing us with a new lens to understand the world around us. And this new 
metaphor is the metaphor of the network. And we can see this shift from trees into networks 
in many domains of knowledge. (Lima 2015) 


Es werden hier gleich mehrere Topoi der Informationsvisualisierung bedient 
(Komplexitätstopos, Perspektiventopos, Novitätstopos) und es wird gleichzeitig 
die gesellschaftliche Wirkung einer Denkfigur gezeigt, wenn Lima die Geburt 
eines kulturellen Memes sieht, die er „networkism“ nennt: 


[...] networks are not just a scientific metaphor. As designers, researchers, and scientists 
try to map a variety of complex systems, they are in many ways influencing traditional art 
fields, like painting and sculpture, and influencing many different artists. And perhaps 
because networks have this huge aesthetical force to them - they’re immensely gorgeous — 
they are really becoming a cultural meme, and driving a new art movement, which I’ve 
called „networkism“. (Lima 2015) 


Mit diesem kulturellen Meme wiirden auch neue Ideen oder Auffassungen por- 
tiert: „decentralization“, „interconnectedness“ und „interdependence“. Das 
Pathos des Vortrags soll Lima nicht angelastet werden, ist es doch formatbedingt. 
Trotzdem muss entgegengehalten werden, dass die Netzwerkidee nicht ganz so 
neu ist und in der diagrammatischen Grundfigur des Graphs grundsätzlich auch 
schon immer angelegt war — wessen sich Lima bewusst ist (Lima 2014). Histori- 
sche Beispiele dafür sind die eingangs erwähnten Brettspiel-Graphen aus dem 2. 
Jahrtausend v. Chr. oder komplexe sogenannte logische Quadrate im Mittelalter, 
die eine Vielzahl von Kontradiktionen als Graph visualisieren (Kruja et al. 2002; 
vgl. für eine umfassende Übersicht zur Geschichte der Netzwerkgraphen Mayer 
2011, 104-164). Mit der Bearbeitung des „Königsberger Brückenproblems“ durch 
Leonhard Euler im Jahr 1736 beginnt dann die Graphentheorie: 

Die Fragestellung war, einen Rundweg durch Königsberg zu finden, auf dem 
jede der sieben Pregel-Brücken genau einmal überquert wird. Euler erkannte, 
dass die genaue Gestalt der Insel und Ufer unwichtig ist und für die Lösung nur 
die „Verbindungseigenschaften“ relevant sind. Euler transferierte den Stadtplan 
in einen Graphen und stellte Insel und Ufer als Punkte (Knoten) und die Brücken 
als Linien (Kanten) dar [...]. Einen Rundweg fand auch Euler nicht, doch er bewies 
als erster schlüssig, dass es keinen geben kann (Pfeffer 2010, 229). 

Die mathematische Graphentheorie entwickelte in der Folge das methodi- 
sche Rüstzeug, um verschiedene Probleme algorithmisch lösen zu können, etwa 
die Berechnung des kürzesten Weges zwischen zwei oder mehr Knoten, was auch 
die Basis aller heutigen geografischen Assistenzsystemen in Karten oder Naviga- 
tionsinstrumenten ist. 
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Von besonderem Interesse für uns ist aber die Übertragung solcher Netzwerk- 
analysen auf soziologische Fragestellungen, die erst im 20. Jahrhundert erfolgte. 
Zwar handelt es sich auch bei den mittelalterlichen Stammbäumen von adligen 
Familien gewissermaßen um die Darstellung von sozialen Netzwerken (Pfeffer 
2010, 229), doch verstehen wir heute unter sozialen Netzwerken natürlich genau 
nicht diese gerichteten Graphen, von denen auch Lima in seinem TED-Vortrag 
behauptet, sie seien nicht adäquat für die Komplexität unserer Welt. Gerade die 
Geschichte der sozialen Netzwerke zeigt die enge Verknüpfung von Zeitgeist und 
diagrammatischer Form. 


Netzwerk - Verlaufskurve 
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— Netzwerk: Gesamt 


Abb. 57: DWDS-Wortverlaufskurve für „Netzwerk“, erstellt durch das Digitale Wörterbuch der 
deutschen Sprache, abgerufen am 22. 9. 2020. Abfrage: https://www.dwds.de/r/plot?view=1& 
norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=10&prune=0&window=3&w 
base=0&logavg=0&logscale=0&xrange=1800%3A2016&q1=Netzwerk 


Die steile Karriere des Netzwerkbegriffs setzt nämlich erst ab den 1960er-Jahren 
ein: Wie Abbildung 57 zeigt, wird der Begriff „Netzwerk“ bis in die 1950er-Jahre 
hinein kaum verwendet (Korpusgrundlage: Ausgewogenes deutschsprachiges 
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Referenz- und Zeitungskorpus, alle vorhandenen Textsorten).*° Entscheidend 
dafür war die Begründung der „Soziometrie“ durch Jacob Levy Moreno (1934), 
der soziale Beziehungen innerhalb einer Gruppe graphisch darstellte (vgl. Abbil- 
dung 58). 


EVOLUTION OF GROUPS 


STRUCTUUR or A KINDERGARTEN 
15 boys and 18 girls, Unchosen 9, RS, NV, FE, MA, TO, AS, RG, SI, 
PR; Pairs 3, AL-WB, WB-SN, SN-LW; Stars, (Centers of Attractions), 


PG, SN, MR; Chains (of relationships), 0; Triangles, 0; Inter-sexual 
Attractions, 19. 


Abb. 58: Skizze der sozialen Beziehungen einer Kindergartengruppe von Moreno (1934, 34) 


Eine weitere Schärfung des Netzwerkbegriffs und des dahinter liegenden Kon- 
zepts findet sich für die qualitative Sozialforschung in den Arbeiten von Elizabeth 
Bott (1957) zu Familienstrukturen (Straus 2013, 34): 


Bott übernahm den Netzwerkbegriff, weil er weit besser als der Gruppenbegriff in der Lage 
war, die empirische Realität der Familienbeziehung zu beschreiben. [...] Trotz der Kritik an 
der Bott’schen Hauptthese hat ihre Studie wesentlich dazu beigetragen, die Netzwerkpers- 
pektive aus einem bloß metaphorischen und zufälligen Gebrauch eines Begriffes zu einem 
systematischen und vielschichtigen Analysewerkzeug zu entwickeln. (Straus 2013, 34-35) 


46 Die Situation ist fürs Englische ähnlich, wie beispielsweise eine Abfrage im „Corpus of His- 
torical American English“ zeigt, wo die Häufigkeiten aber bereits in den 1940er-Jahren stärker 
zunehmen (vgl. https: //www.english-corpora.org/coha/ letzter Zugriff: 22.9 2020). 
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Hinter allen soziologischen Anwendungen von Netzwerken steht die Idee, damit 
etwas Unsichtbares sichtbar zu machen. Ausgangspunkt ist die Prämisse, dass 
eine Gruppe mehr ist als die Summe ihrer Teile. Einerseits der Kunstgriff, Rela- 
tionen zwischen Akteuren zu visualisieren, andererseits der Effekt des Zusam- 
menspiels aller Knoten und Kanten insgesamt, der nicht vorausgesehen werden 
kann, werden als Möglichkeit angesehen, dieses Mehr als die Summe aller Teile 
sichtbar zu machen: 


An dem Fallbeispiel [einer Netzwerkanalyse, NB] dürfte deutlich geworden sein, dass die 
Verschiebung des forscherischen Blicks auf das Dazwischenliegende - auf die Welt der Rela- 
tionen — nicht nur völlig neue Zugänge zu scheinbar vertrauten Gegenständen der Soziologie 
— wie z. B. der Ungleichheitsthematik - eröffnet, sondern wesentliche Aspekte des Sozialen 
an den Tag legt, die anderweitig nicht gewonnen werden können. (Häußling 2010, 76) 


Die Verwendung von Netzwerken in psychosozialen Kontexten in den 60er-Jah- 
ren wurde von der breiten Öffentlichkeit zunächst nicht wahrgenommen. Erst 
die gesellschaftlichen Veränderungen in den 1980er-Jahren wirkten als Verstär- 
ker dieser Ideen: die Institutionalisierung sozialer Unterstützungsangebote und 
„die Hoffnung|,] über netzförmige Formen der Zusammenarbeit einen Schlüssel 
für nicht entfremdete, selbstbestimmte Formen des Arbeitens und der Koopera- 
tion zu finden“ (Straus 2013, 39). In den 1990er-Jahren bewirkte die Trilogie des 
Soziologen Manuel Castells zur Weltgesellschaft als Netzwerkgesellschaft („The 
Information Age: Economy, Society, and Culture“) eine breite Popularisierung 
des Netzwerkbegriffs (Castells 1996, 1997, 1998). 


Obwohl selbst kein klassischer Netzwerkforscher, finden sich in seinen Analysen die 
Wurzeln dessen, was ich als zweiten Boom der Netzwerkidee bezeichnen möchte. Castells 
begründet diesen Trend zur Netzwerkgesellschaft mit drei Entwicklungen: dem Bedürfnis 
der Wirtschaft nach flexiblem Management und globalisiertem Kapital, einem Bedürfnis der 
Menschen nach individualisierten Werten und offener Kommunikation und außerordentli- 
chen Fortschritten der Computertechnologie und der Telekommunikation. (Straus 2013, 15) 


Obwohl also das Netzwerk aus graphtheoretischer Sicht nur ein Spezialfall eines 
Graphs ist, machen die oben genannten Entwicklungen in der Soziologie deut- 
lich, dass der Netzwerkgraph als neue Form wahrgenommen wird, die ein neues 
Modell zur Beschreibung von Welt bietet. Wenn für diese Auffassung die soziolo- 
gische Reinterpretation von Netzwerkgraphen verantwortlich war, dann ist deren 
ausgeweitete Verwendung in weiteren Wissenschaften in den letzten etwa zehn 
Jahren eine weitere Stufe des Booms. Der Erfolg von Web-2.0-Anwendungen (wie 
Social Media) und die populärwissenschaftliche Nutzung von Netzwerkdarstel- 
lungen sind weitere Aspekte dieses Booms. Alle diese Aspekte begünstigen sich 
wechselseitig. 
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Man könnte auf die Idee kommen, dass mit dem Netzwerkdiagramm ein Werk- 
zeug entstanden ist, dass es erlaubt, soziale Netzwerke überhaupt erst sichtbar 
zu machen. Doch ich pflichte Katja Mayer bei, die in ihrer Dissertation „Imag(in) 
ing Social Networks“ die gegenteilige These vertritt: Die Visualisierung ist imma- 
nenter Teil jeglicher Netzwerkanalyse: 


Die Beschäftigung mit der historischen Dimension der Netzwerkdiagramme bringt mich 
schließlich zu der Einsicht, dass soziale Netzwerke niemals unsichtbar gewesen sein 
können. Sie haben keine pre-visuelle Geschichte, sind immer eingebettet in Viskurse. 
Denn von den Ansichten der mikroskopischen Blutgefäße bis zum weltumspannenden 
Internet, von evolutionären Verästelungen bis zu sozialen Strukturen - sobald diese als 
netzwerkartiges Beziehungsgefüge beschrieben wurden, waren sie immer zugleich auch 
Anschauungsform. Diese Netzwerke wurden nicht nachträglich sichtbar gemacht, sondern 
erschlossen sich als Netzwerke erst in ihrer Darstellungsweise. Das Netz wurde erst zum 
Werk als es in den zeichentechnisch und epistemisch über Kreuzungspunkte und Linien 
vermittelten Blick kam und sich Ordnung, und Transfer zwischen Punkten als zentrale 
Untersuchungsgegenstände etablierten. So betrachtet wird verständlich, warum im sko- 
pischen Regime der Vernetzung alternative Anschauungsformen in den Diskursen der 
wissenschaftlichen Netzwerkforschung schwierig zu etablieren sind, und dass der sozio- 
grammatische Denkstil aufgrund seiner vielfältigen Entwicklungsgeschichte eine solche 
Dominanz entfalten konnte. (Mayer 2011, 162) 


5.5.4 Netzwerkgraphen und Zauber 


Eine Besonderheit von Netzwerkgraphen als Spezialform der diagrammatischen 
Grundfigur Graph ist deren Status in der Wissenschaft: Im Gegensatz zu den Visu- 
alisierungen, die auf den anderen vier diagrammatischen Grundfiguren beruhen 
- und auch im Gegensatz zu den Baumdarstellungen - wird den Netzwerkdarstel- 
lungen oft eine Art Zauber zugeschrieben. Ein Aspekt dieses Zaubers ist das allen 
Diagrammen innewohnende Potenzial, die in ein Diagramm transferierten Daten 
und durch die Operationen mit dem Diagramm einen neuen Blick auf die Daten 
zu erhalten und neue Erkenntnisse gewinnen zu können. Bei den Netzwerkgra- 
phen kommt aber ein weiterer Aspekt hinzu, der mit der (unterstellten) Komplexi- 
tät ihrer zugrundeliegenden Algorithmen und ihrer Erscheinungsform zu tun hat. 
Katja Mayer konnte in ihrer Feldforschung zur Praxis der sozialen Netzwerkana- 
lyse zeigen, wie die Forschenden in ihren ersten Kontakten mit Netzwerkgraphen 
diese als ästhetisch attraktiv und deshalb interessant wahrgenommen haben. 
Mayer (2011, 166) zitiert einen Interviewpartner, der von seinem ersten Kontakt 
mit sozialen Netzwerkanalysen erzählt, wie folgt und kommentiert: 
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„Die netzwerkanalytischen Berechnungen habe ich gar nicht verstanden, aber habe die 
Visualisierungen gesehen und die fand ich sehr faszinierend. Wie man Tauschgeschenke 
in einer Gesellschaft zeigen kann, wer mit wem. Das hat mich intuitiv so angesprochen, 
dass ich dachte: so was will ich auch [...] haben.“ [...] Erst nach und nach hat sich diesem 
Erziehungswissenschaftler über die Arbeit an Visualisierungen zu seinen Interviewaus- 
wertungen auch die Methode erschlossen. Doch bereits im ersten Blick erschloss sich ihm 
gefühlsmäßig das beziehungsweisende Potential der Methode durch ihre Bildlichkeit. 
(Mayer 2011, 166) 


Wie kaum andere Diagramme faszinieren gegenwärtig Netzwerkdarstellungen, 
wie auch der weiter oben erwähnte TED-Vortrag von Lima (vgl. Abschnitt 5.5.3) 
oder ein Blick in populärwissenschaftliche Bücher zu wissenschaftlichen Visua- 
lisierungen oder Infografiken zeigen, die viele Netzwerkabbildungen enthalten.“ 

Dass Visualisierungen ästhetisch ansprechend sein können, ist selbstver- 
ständlich kein Alleinstellungsmerkmal für Netzwerkgraphen und auch eine 
plausible Motivation, den wissenschaftlichen Nutzen solcher Visualisierungen 
zu prüfen. Auffallend insbesondere bei den sozialen Netzwerkanalysen ist aller- 
dings, dass auch in Lehrbüchern und generell in der Ausbildung von Sozialwis- 
senschaftlerinnen und -wissenschaftler offensichtlich die technischen Hinter- 
gründe der Graphen selten thematisiert wird: 


Die gängigen Lehrbücher [...] zur Sozialen Netzwerkanalyse reflektieren ihre Bildverwen- 
dung kaum. Bildunterschriften enthalten meist nur fragmentarische Angaben zu Qualitäten 
und bestehen größtenteils aus Quellenangabe und Bildtitel. Im Diagramm eingebettet sind 
höchstens die Attribute der Knoten und Kanten, sowie die Skala der Zuweisungen von 
Farben und Formen zu weiteren Attributen. Anleitungen zur — oder Beschreibungen der 
Produktion solcher Visualisierungen sucht man im begleitenden Text vergeblich. [...] Stu- 
dierenden der sozialen Netzwerkanalyse wird also in den gängigen Lehrbüchern die Visua- 
lisierung nicht als aufwändige Technik vermittelt, sondern als selbstverständliche, unhin- 
terfragte Beigabe, mehr oder weniger als Illustration des Textes. (Mayer 2011, 170) 


Dem Wunsch, fasziniert von den Darstellungen sofort mit den eigenen Daten los- 
legen zu können, ohne sich vorher intensiv mit den technischen Grundlagen aus- 
einandersetzen zu müssen, wirkt eine Software wie „Gephi“ (Bastian et al. 2009) 
entgegen: 


47 Nimmt man die Javascript-Bibliothek D3.js zum Maßstab, die für viele Datenvisualisierun- 
gen im wissenschaftlichen und nicht-wissenschaftlichen Kontext verwendet wird, zeigt sich: Die 
dort aufgeführten Beispieldiagramme (https://github.com/d3/d3/wiki/Gallery, letzter Zugriff: 
22.9.2020), insgesamt etwa 370 Diagramme, zeigen in etwa 20 % der Fälle Graphen oder kombi- 
nieren andere Diagrammformen mit Graphen. 
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Gephi is a tool for data analysts and scientists keen to explore and understand graphs. Like 
Photoshop™ but for graph data, the user interacts with the representation, manipulate the 
structures, shapes and colors to reveal hidden patterns. The goal is to help data analysts 
to make hypothesis, intuitively discover patterns, isolate structure singularities or faults 
during data sourcing. It is a complementary tool to traditional statistics, as visual thinking 
with interactive interfaces is now recognized to facilitate reasoning. This is a software for 
Exploratory Data Analysis, a paradigm appeared in the Visual Analytics field of research. 
(Website zu Gephi - Features, https://gephi.org/features/, letzter Zugriff: 22. 9.2020) 


Die im Text genannte Vorbildsoftware „Photoshop“ ist eine seit 1990 existie- 
rende Bildbearbeitungssoftware, die die digitale Bearbeitung von Bildern tiber 
eine grafische Benutzeroberflache revolutioniert hat (vgl. fiir eine ausfiihrliche 
medienkritische Reflexion zu Photoshop Manovich 2002, 124ff.). Photoshop als 
Metapher steht also fiir einfache Bedienung kombiniert mit komplexen Effek- 
ten, deren genaue Funktionsweise irrelevant ist, da durch eine visuelle Kontrolle 
sofort (und live) überprüft - WYSIWYG - sowie jeder Schritt wieder rückgängig 
gemacht werden kann.’ Diese Bedienungsweise wird dann gemeinhin als „intu- 
itiv“ bezeichnet.*? Gephi funktioniert ähnlich, da beispielsweise die Auswirkun- 
gen der unterschiedlichen Layoutmodi, also den Algorithmen, die die Anordnung 
von Knoten und Kanten nach unterschiedlichen Modellen regeln, als Live-Anima- 
tion direkt beobachtet werden kann. 

Hierzu muss ich kurz ausholen, denn der Effekt ist bemerkenswert: Wenn 
eine Reihe von Knoten und Kanten dazwischen gegeben sind, müssen die Knoten 
nach einem bestimmten Prinzip auf der Fläche angeordnet werden - sei es ein 
zufälliges Prinzip (vgl. Pfeffer 2010, 230). Es gibt ganz verschiedene Prinzipien, 
etwa eine kreisförmige Anordnung, eine hierarchische oder eine Anordnung, die 
physikalische Kräfte modelliert (vgl. dazu auch Abschnitt 5.5.1). Das Prinzip kann 
durch eine Reihe von Bedingungen eingeschränkt werden, etwa: 

- Knoten dürfen sich nicht überlappen. 
- Knoten benötigen einen Mindestabstand zueinander. 
- Kanten dürfen sich nicht schneiden. 


48 Bei Photoshop erlaubt eine Plug-in-Architektur die Integration von Filtern, mit denen auf 
der Basis komplexer Algorithmen das Bild bearbeitet werden kann. Neben den aus der foto- 
grafischen Dunkelkammer bekannten Manipulationen des Kontrastes und der Retusche, gehö- 
ren auch automatische Fleckenentfernung, Erkennung von Objekten zwecks Freistellung etc. 
hinzu. 

49 Die signifikantesten Kollokatoren zu „intuitiv“ im Deutschen Referenzkorpus DeReKo lauten: 
Bedienung [einfach], eher [als], Benutzeroberfläche [grafische, bedienende]. Vgl. eine Abfrage 
nach „intuitiv“ in der Kookkurrenzdatenbank des IDS (Belica 2001). 
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- Die Kantenlängen sind vorgegeben, etwa in Abhängigkeit einer irgendwie 
gemessenen Nähe zwischen den Knoten. 
= EtG: 


Wenn solche Bedingungen gegeben sind, müssen beim Layout zwangsweise 
Kompromisse eingegangen werden, je mehr, desto größer das Netz und desto 
zahlreicher die Bedingungen sind. 

Fin beliebtes Layoutprinzip ist eines, das physikalische Federkräfte zwi- 
schen den Knoten simuliert („Spring Embedder“ oder auch ,,force-directed“ o. a. 
genannt). Die Feder zwischen den Knoten hat eine Federkonstante, also eine 
optimale Länge, die unter Kraft verkürzt oder gedehnt werden kann (Pfeffer 2010, 
230). Über den gesamten Graph hinweg gesehen ergibt sich über mehrere Itera- 
tionen ein Kräfteoptimum, indem die Knoten entsprechend umplatziert werden. 
Dies ist durchaus ein rechenintensiver Prozess, der algorithmisch auf verschie- 
dene Weisen optimiert worden ist. 

Wenn man nun in einer Software wie Gephi den Layoutmodus ändert, wird 
das Re-Arrangement der Knoten als Animation gezeigt: 


Highly configurable layout algorithms can be run in real-time on the graph window. For 
instance speed, gravity, repulsion, autostabilize, inertia or size-adjust are real-time set- 
tings of the Force Atlas algorithm, a special force-directed algorithm developed by our team 
(Bastian et al. 2009, 361). 


Die Arbeitsweise des Algorithmus ist also quasi-synchron und damit direkt 
optisch wahrnehmbar, zumindest im besten Fall, da die grafische Darstellung 
und die Berechnungen aus Gründen des Rechenaufwands nicht immer 1:1 parallel 
dargestellt werden können. Die Animation wird aber auch dann dargestellt, wenn 
der Algorithmus viel rascher bei der Lösung des Darstellungsproblems angelangt 
ist, als die Darstellung suggeriert. Aber die grafische Transformation vom einen 
zum anderen Modus hat den Effekt, die Veränderung sinnlich wahrnehmbar zu 
machen, bzw.: die Simulation der Veränderung, da keine durchgehende 1:1-Paral- 
lelität zwischen Rechenschritt und Darstellung zu erwarten ist. 

Die Animation zwischen den Layoutmodi ist ästhetisch ansprechend - und 
die Ästhetik wird weiter getrieben, indem etwa auch mit der Maus mit dem Netz 
interagiert werden kann: Zieht man an einem Knoten, hat die neue Position des 
Knotens Auswirkungen auf das ganze Netz, die sogleich dargestellt werden. Lässt 
man ihn los, schnellt er federnd zurück. 

Der Preis für die verständlichen Bemühungen der Entwickler von Gephi, eine 
einfach bedienbare Software zu erstellen, ist der Verlust der Distanz zwischen 
Algorithmus, Diagramm und Bedienung. Jägers Konzept der medialen Transpa- 
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renz, bzw. meine Übertragung auf die Diagrammatizität, die bei einer störungs- 
freien Verwendung gewährleistet ist, hilft auch hier beim Verständnis des Effek- 
tes: Algorithmizität und Diagrammatizität werden vollkommen transparent und 
es wird der Eindruck erweckt, dass man mit dem Netzwerk als solches interagiert. 
Oder anders gewendet: Der Untersuchungsgegenstand ist gleichbedeutend mit 
dem Netz; er ist nicht netzartig, nein, er ist das Netz. So ist Mayers Gedanke, dass 
soziale Netze nie eine pre-visuelle Geschichte hatten, nochmals neu fassbar (vgl. 
Abschnitt 5.5.3).>° 


5.5.5 Linguistische Netze 


Nun ist der Zeitpunkt gekommen, die Verwendung von Netzgraphen für lingu- 
istische Zwecke zu skizzieren. Die oben dargelegten Überlegungen zur Genese 
der sozialen Netze sind dabei ein guter Hintergrund, um die Netzideen in der 
Semantik zu diskutieren. Ausgangspunkt ist die Frage, wie Wortschatz struktu- 
riert ist. Ein Vergleich von einschlägigen Handbüchern und Einführungen, etwa 
des Handbuches „Wort und Wortschatz“ (Haß/Storjohann 2015) mit dem älteren 
Semantik-Band der Reihe „Handbücher zur Sprach- und Kommunikationswis- 
senschaft“ (HSK) (Stechow/Wunderlich 1991), offenbart ein deutlich veränderte 
Konzeption von Semantik. Dies zeigt sich auch in den verwendeten Diagrammen. 
So findet sich etwa im Einleitungstext des Handbuches „Wort und Wortschatz“ 
von Ulrich Schnörch (2015, 23) die in Abbildung 59 wiedergegebene Darstellung 
eines Kollokationennetzes, um die Bedeutung von „Wortschatz“ anzugeben. Der 
HSK-Band dagegen steht hauptsächlich im Zeichen der Wahrheitsbedingungen- 
Semantik, wie John Lyons (1991, 20) in seinem einführenden Text deutlich macht. 
In Lyons bekannter Einführung in die Semantik (Lyons 1977) finden sich somit 
auch nur spärlich Diagramme - definitiv keine Netze, darunter aber das in Abbil- 
dung 61 wiedergegebene Diagramm eines „model of a hierarchically organized 
vocabulary“ (Lyons 1977, 295). 


50 Unter dieser Hypothese wäre auch das Phänomen der Social Media-Anwendungen des Web 
2.0, wie etwa Facebook, neu zu denken: Erst die Erfindung des Netzwerkgraphen ermöglichte 
Facebook, ansonsten könnte Freundschaft gar nicht als Netz wahrgenommen werden, so ver- 
traut uns dieser Gedanke heute ist. 
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Abb. 59: Darstellung eines Netzes von nach satzsemantischen Rollen gruppierten Kollokatoren 
zu „Wortschatz“ mit Hilfe des Werkzeugs „VICOMTE“ bei Schnörch (2015, 23) 


Netzdarstellungen sind inzwischen bei semantischen Phänomenen üblich. Es 
existieren verschiedene Werkzeuge, um Netzwerkgraphen als Ausdruck von Kol- 
lokationsverhalten von Lexemen zu erstellen, neben VICOMTE beispielsweise 
auch GraphColl (Brezina et al. 2015), von dem Abbildung 60 eine Originalabbil- 
dung aus dem das Tool begriindenden Aufsatz zeigt (Brezina et al. 2015, 153). 

Es muss betont werden, dass die Abbildungen 59-61 zwar alle semantische 
Phänomene, jedoch Phänomene unterschiedlicher Art visualisieren. Brezina et 
al. zeigen anhand von GraphColl, wie die Visualisierung von Kollokationsdaten 
als Netzgraph es ermöglichen, ein ganzes Wortfeld semantisch zu deuten, um so 
Informationen über den Gebrauch und damit die Bedeutung eines Wortes offen- 
zulegen (Abbildung 60). Ähnlich funktioniert das von Schnörch gezeigte Beispiel 
mit dem Analysewerkzeug VICOMTE, das einerseits die primären Kollokatoren 
von „Wortschatz“ zeigt, es daneben aber erlaubt, zusätzliche Knoten auf einer 
Metaebene einzufügen, um die Kollokatoren zu bündeln und damit in verschie- 
dene Lesarten zu klassifizieren (Abbildung 59). 
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Abb. 60: Demonstration des Programms GraphColl mit der Ausgabe von Kollokatoren bis zu 
vierter Ordnung ausgehend von ,,time“ (Brezina et al. 2015, 153) 


Nicht in Form eines ungerichteten Graphen, sondern eines gerichteten Baum- 
graphen, skizziert Lyons das Modell der Ordnung eines Wortschatzes, das sich 
an den semantischen Relationen der Hyponymie und Hyperonymie orientiert 
(Abbildung 61). Er möchte damit keine konkrete semantische Analyse vorneh- 
men, sondern ein abstraktes Modell vorschlagen, wie Wortschatz gegliedert sein 
könnte, wobei er vorsichtig formuliert: 


So far relatively little is known about the lexical structure of the vast majority ofthe world’s 
languages; and, as we have seen, it is as yet impossible to evaluate, even for well studied 
and easily accessible European languages, the hypothesis that the vocabulary is hierar- 
chically ordered, as a whole, in terms of hyponymy and quasi-hyponymy. The theoretical 
semanticist should be correspondingly cautious about putting forward general hypotheses 
of this kind. It is undeniable, however, that there is some degree of hierarchical organiza- 
tion in all areas of the vocabularies of languages that have been investigated. Indeed, it is 
hard to conceive of any language operating satisfactorily in any culture without its vocabu- 
lary being structured in terms of the complementary principles of hyponymy and contrast; 
and the descriptive work that has been done on various areas of the vocabulary in particular 
languages appears to support this conclusion (Lyons 1977, 301). 
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Abb. 61: Ein Modell eines hierarchisch organisierten Wortschatzes nach Lyons (1977, 295) 


Die Diagramme widerspiegeln also grundsätzlich unterschiedliche Vorstellungen 
von „Wortschatz“. Lyons Modell ist strukturalistisch geprägt und steht in der Tra- 
dition formal-logischer Modelle: 


Die Arbeiten von Lyons (1968), Cruse (1986) und Lutzeier (1981) sind vom Streben nach 
erschöpfenden Klassifikationsmodellen geprägt, die Sinnrelationen innerhalb stabiler und 
sezierbarer Wortschatzstrukturen formal-linguistisch definieren. Sie erarbeiteten eine an 
die sprachanalytische Philosophie und Logik angelehnte Terminologie (Storjohann 2015, 
254). 


Auch ein Vorhaben wie etwa „WordNet“ (Miller et al. 1990; Fellbaum 2001) steht 
in dieser Tradition und gliedert Wortschatz auf der Basis von Hyponymie-Rela- 
tionen als hierarchischer Baum. Trotzdem wird die Gliederung „Netz“ genannt, 
was eher an einen nicht-hierarchischen Netzwerkgraph denken lässt; der Grund 
dafür liegt sicher darin, dass sich mit der Integration von Angaben zu meronymi- 
schen und antonymischen Beziehungen durchaus netzartige Querverbindungen 
ergeben, wie beispielsweise auch ein Diagramm von George A. Miller (1990, 260) 
zur Struktur von Nomen zeigt (s. Abbildung 62, S. 192). 

Petra Storjohann entwirft in ihrem Handbuchartikel zu „Sinnrelationale[n] 
Wortschatzstrukturen“ ein Gegenprogramm im Geist des gesamten Handbuches, 
das Sprache als dynamischen, sozial-interaktiven Prozess und eine gebrauchsba- 
sierte, empirische Semantik modelliert: 


Heute wissen wir, wie sehr die empirische Wende in der Linguistik die Forschung der Sinn- 
relationen revolutionierte und das Interesse auf die dynamische Natur und das flexible Ver- 
halten von Beziehungsgeflechten in Text und Diskurs lenkte (Storjohann 2015, 259). 


Diagrammatisch werden die „traditionellen Ansätze“ durch Darstellungen von 
Syntagma und Paradigma sowie durch eine Tabelle einer Komponentenanalyse 
repräsentiert. Interessanterweise findet sich im Text von Storjohann aber kein 
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Noun Structure 


—— hyponymy > antonymy TA meronymy 


Abb. 62: „Network representation ofthree semantic relations among an illustrative variety of 
lexical concepts“ in WordNet (Miller 1990, 260) 


Beispiel für ein neuartiges Diagramm, das den Gegenentwurf repräsentieren 
könnte; sie arbeitet mit Listen und Tabellen, die Belege und Formulierungsscha- 
blonen enthalten, nicht mit Netzwerkgraphen. Im Hintergrund stecken Kolloka- 
tionsanalysen, die jaim Kern auch die diagrammatischen Grundfiguren der Liste 
und der Vektoren enthalten, insofern ist der Netzwerkgraph auch nicht zwingend 
die folgerichtige Darstellung für Ergebnisse einer gebrauchssemantisch fundier- 
ten, auf Kollokationen beruhenden semantischen Analyse. Auch im Text von 
Cyril Belica und Rainer Perkuhn (2015) im selben Band zu Kollokationen und 
syntagmatischen Mustern finden sich keine Netzwerkgraphen, sondern im Kern 
eine Tabellenart zur Darstellung der Ergebnisse ihrer Berechnung von Kollokatio- 
nen und syntagmatischen Mustern (auch online nutzbar: Belica 2001). Trotzdem: 
Semantische Analysen, die sich im gebrauchssemantischen Paradigma einord- 
nen, bedienen sich manchmal Netzwerkdiagrammen, um Analyseergebnisse dar- 
zustellen. 


5.6 Effekte diagrammatischer Grundfiguren 


Die letzten fünf Abschnitte postulierten nun fünf diagrammatische Grundfiguren, 
die bei der Arbeit mit sprachlichen Daten besonders wichtig sind: Listen, Karten, 
Partituren, Vektoren und Graphen, wobei gerade bei letzteren die Unterschei- 
dung zwischen Bäumen und Netzgraphen wichtig ist. Ich habe jeweils versucht, 
die grafische Geschichte der Grundfiguren zu skizzieren und ihre Übernahme in 
die Linguistik zu beschreiben, ohne den Anspruch auf Vollständigkeit (sowohl 
was die Geschichte als auch die Anwendung in der Linguistik betrifft) zu erheben. 
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Im folgenden Abschnitt möchte ich die angestellten Überlegungen nun insofern 
systematisieren, als dass ich nach den Effekten dieser diagrammatischen Grund- 
figuren auf sprachliche Daten fragen möchte. Welche Arten von Transformatio- 
nen sind mit den Überführungen in die jeweiligen Diagrammtypen verbunden? 
Was wird damit gewonnen, was wird dabei verloren? 


Abb. 63: Darstellung der fünf diagrammatischen Grundfiguren 


Ich sehe insgesamt vier Effekte, die durch die diagrammspezifischen Transfor- 
mationen entstehen und somit vier Transformationstypen ergeben: Rekontextu- 
alisierung, Desequenzialisierung, Dimensionsanreicherung und Rematerialisie- 
rung. Jede diagrammtische Grundfigur kann hinsichtlich dieser Effekte darauf 
hin geprüft werden, wie stark sie davon betroffen sind. 


5.6.1 Rekontextualisierung 


Die Rekontextualisierung ist ein sehr grundlegender Effekt, den Diagramme auf 
sprachliche Daten ausüben. Er besteht zunächst aus einer Dekontextualisierung, 
mit der sprachliche Entitäten aus ihrem ursprünglichen Kontext entfernt werden. 
Das geht aber gleichzeitig mit einer Rekontextualisierung einher, da diese Enti- 
täten nicht kontextlos bleiben, sondern im Ensemble einen neuen Gegenstand 
bilden und so jede der Einheiten wieder in einen neuen Kontext bildet. 
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Abb. 64: Rekontextualisierung 


Listen sind ein prototypisches Beispiel, bei denen eine Rekontextualisierung 
eintritt. Bei den alphabetisch systematisierten Glossen, die so zum Worterbuch 
werden oder bei der Konkordanz oder Keyword-in-Context-Liste, die Kontexte 
eines Suchwortes versammeln, entsteht durch die Auflistung für die jeweiligen 
Entitäten (Wörter) ein neuer Kontext. Es ist gerade die Motivation bei der Erstel- 
lung einer Liste, den ursprünglichen Kontext zu zerstören und Entitäten mitei- 
nander in Verbindung zu bringen, die im Textgeflecht, in dem sie sich vorher 
befanden, voneinander isoliert waren. 

Die Liste ist postulierte Ähnlichkeit: Sie behauptet einen Bezug aller versam- 
melten Entitäten untereinander und hat zudem organisierenden Charakter. Dies 
zeigt sich beispielsweise mit Jack Goodys Unterscheidung von drei Typen von 
Listen: Lexikalische Listen, Ereignislisten und administrative Listen (Goody 1977, 
80; Echterhölter 2015, 248). So bietet etwa eine „king list“ als Ereignisliste eine 
chronologische Orientierung und sorgt „für eine Festschreibung und Vereindeu- 
tigung des kollektiven Gedächtnisses“ (Echterhölter 2015, 250). Die „shopping 
list“ als Beispiel für eine administrative Liste verleiht dem Handeln Struktur, 
indem sie Aufgaben vorgibt, und lexikalische Listen sind Proto-Enzyklopädien 
und entwerfen ein Abbild der Welt (Echterhölter 2015, 249/250). 

Der Keyword-in-Context-Liste in der Linguistik wohnen Aspekte aller drei Lis- 
tentypen von Goody inne und es wäre zu kurz gedacht, sie als lexikalische Liste 
abzutun. Zunächst ähnelt sie nämlich einer Freignisliste, da sie aus der Sequenzi- 
alität von Text die gesuchten Einheiten als Ereignisse auffasst und versammelt.>* 


51 Bei der digitalen Suche nach einem Suchausdruck in einer Textmenge müssen Daten zwin- 
gend sequentiell abgearbeitet werden, egal ob sie bereits vorverarbeitet als Index zur Verfügung 
stehen oder sozusagen „live“ ein Text durchgearbeitet wird, um einen Suchstring zu finden. 
Auch wenn die Suche auf mehrere Prozesse aufgeteilt und parallel abgearbeitet wird, sind die 
einzelnen Suchprozesse zwingend sequentiell - und die Fundstellen sind Ereignisse, die erstmal 
genau in der Ordnung des Auffindens auch zurückgegeben werden. 
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Die KWiC-Liste ist deshalb zunächst eine Ereignisliste, insofern sie das Ergebnis 
einer Suche darstellt. Wenn mit der Liste diagrammatisch operiert wird, gewinnt 
sie die Handlungsaspekte einer administrativen Liste hinzu: Sie ist eine Anlei- 
tung zur Interpretation, die entweder jedem einzelnen Eintrag der Liste gerecht 
werden will oder aber eine Musterhaftigkeit in ihrem Ensemble sieht. Damit ist 
die Liste eben nicht nur einfach ein Verweisindex auf die ursprünglichen Kon- 
texte, sondern bildet zusätzlich einen neuen Kontext. 

Dass die KWiC-Liste einen eigenständigen Gegenstand bildet und es gerade 
der Gewinn ist, die einzelnen Zeilen darin ihrem Kontext entrissen und rekon- 
textualisiert zu haben, mag eine triviale Erkenntnis sein. Allerdings ist es in der 
linguistischen Praxis immer wieder erstaunlich, auf wie viel Widerstreben diese 
Transformation doch stößt, etwa wenn man sich den Bereich der Diskurslingu- 
istik ansieht. In der, oft sich auf Michel Foucault berufenden, Diskurslinguis- 
tik werden korpuslinguistische Methoden seit einiger Zeit als nützlich erachtet 
(Spitzmiiller/Warnke 2011, 25). In der - auch von mir vertretenen - datengeleite- 
ten Diskurslinguistik spielt dabei der Einzeltext für die Interpretation von Diskurs 
keine bedeutende Rolle mehr, stattdessen ist es musterhafter Sprachgebrauch 
als Spuren diskursiven Handelns (Bubenhofer 2009; Bubenhofer/Scharloth 
2015; Scharloth et al. 2013; Lemke/Wiedemann 2016). So stehen beispielsweise 
maschinell berechnete Mehrworteinheiten, die statistisch für bestimmte Akteure, 
Institutionen oder Zeitepochen typisch sind, im Vordergrund, die anschließend 
diskurslinguistisch gedeutet werden. Diese Menge an Mehrworteinheiten mit 
gemeinsamer Typik hinsichtlich eines bestimmten Aspektes sind eine rekontex- 
tualisierte Liste - mit Sprengkraft. Denn - so die Kritik — wie sollen die einzel- 
nen Mehrworteinheiten ohne Rückgriff auf die „ursprünglichen“ Kontexte in den 
„eigentlichen“ Texten korrekt gedeutet werden? Dieser Einwand wird dann zur 
Konstruktion einer Dichotomie zwischen quantitativen und qualitativen Metho- 
den verwendet und im besten Fall gefordert, dass beides miteinander verbunden 
werden müsse (Spitzmiiller/Warnke 2011, 39; Niehr 2015, 144).>” Die Frage ist also, 
ob die rekontextualisierte Liste ernst genommen wird oder nicht — ob der Pakt mit 
dem Teufel eingegangen wird, wie es der Literaturwissenschaftler Franco Moretti 
ausgedrückt hat: „what we really need is a little pact with the devil: we know how 
to read texts, now let’s learn how not to read them“ (Moretti 2000, 57).?? 


52 Dass quantitativ und qualitativ nicht als Dichotomie aufgefasst werden muss, ohne aber die 
quantitative Analyse zur Alibianalyse verkommen zu lassen und stattdessen ernsthaft datenge- 
leitet zu denken, versuchte ich andernorts zu zeigen (Bubenhofer 2013a). 

53 Vel. fiir eine weiterfiihrende Diskussion auch Bubenhofer (2016b). 
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Listen stellen zwar eine prototypische rekontextualisierende Transformation dar, 
der Effekt zeigt sich aber auch bei den anderen diagrammatischen Grundfiguren 
deutlich: Karten rekontextualisieren nach geografischen Kriterien, Graphen nach 
Beziehungen, Vektoren bilden einen geometrischen Raum und Partituren durch 
die Alignierung von Stimmen. Um die transformierende Kraft eines Diagramms 
zu bewerten, ist die Kategorie der Rekontextualisierung ein bedeutender Aspekt, 
um zu verstehen, welcher Art das neu rekontextualisierte Objekt ist. In der gerade 
kurz berührten Diskussion zu Einzeltext und Sprachgebrauchsmuster in der Dis- 
kurslinguistik wird durch die Brille der Rekontextualisierung klar, dass diagram- 
matische Operationen auf Listen von Sprachgebrauchsmustern nicht einfach 
einen quantitativen Blick auf Einzelbelege im Sinne von ,,vielen Einzelbelegen“ 
bedeuten, sondern einen Blick auf Strukturen, die emergent gegenüber der Masse 
von Einzelbelegen sind, ermöglichen. Die Strukturen sind ein Phänomen, das 
sich nicht aus der Summe der Einzelbeobachtungen erklären lässt, sondern mehr 
als das ist. 

Bereits das einfache Beispiel eines Kollokationsprofils eines Lexems verdeut- 
licht dies: Es handelt sich um eine statistische Zusammenfassung des Distributi- 
onsverhaltens des Lexems in einem Korpus. Daraus entsteht ein Bild, das zeigt, 
wie das Lexem normalerweise verwendet wird. Ein solches Distributionsverhalten 
kann als Vektor repräsentiert und damit in einen Vektorraum überführt werden, 
um beispielsweise semantische Felder zu berechnen (Keibel/Belica 2007) oder 
Lexempaare, die in gleichen semantischen Relationen zueinander stehen (Word 
Embeddings: Mikolov et al. 2013). Der Einzelbeleg ist bei solchen Analysen unbe- 
deutend und kann dem emergenten Profil sogar widersprechen. Interessiert ist 
man an der zusammenfassenden Darstellung, die genug ungenau ist, um das 
Wesentliche vom Unwesentlichen zu trennen (Bubenhofer 2016b, 353). 


5.6.2 Desequenzialisierung 


Die lineare Organisation sprachlicher Äußerungen ist, nicht erst seit Saussure 
und seiner „chaine parl&e“ (Saussure 1916, 176), ein vieldiskutiertes Phänomen. 
Gerade im Kontext von Bildern, mit denen wir es ja hier zu tun haben, stellt sich 
dabei die Frage nach der Differenz zwischen Bild und Text. Werden Bilder nicht 
genauso „gelesen“ wie Text? Ist es so überhaupt gerechtfertigt, Linearität oder 
Sequenz als Alleinstellungsmerkmal von Text anzusehen? Konrad Ehlich gibt 
dazu eine deutliche Antwort: 


Der mündliche Text ist eine Abfolge in der Zeit. Die Linearität des sprachlichen Handelns 
charakterisiert dies von Anfang an. Die Überwindung der Flüchtigkeit des Äußerungsaktes 
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in der Verdauerung zum Text hebt fiir jede einzelne Instantiierung diese Linearitat nicht 
auf. 

Erst bei der Verdinglichung des Textes zum visuell sichtbaren Objekt entsteht der Ein- 
druck, als sei dies anders: Der schriftliche Text als ganzer kann visuell erfaßt werden. Sobald 
er aber als Text rezipiert, also gelesen, werden soll, ist die Linearität, die der sprachlichen 
Handlungsfolge innewohnt, wiederherzustellen: Der Prozeß der Lektüre re-linearisiert das 
semantische Potential (Ehlich 2007b, 614). 


Natürlich kann man metaphorisch durchaus von einer Lektüre von Bildern spre- 
chen, es handelt sich jedoch um eine grundsätzlich andere Art der Lektüre als bei 
geschriebenen Texten. Diese Lektüre ist sprunghaft, während der Text nur dann 
voll verstanden wird, wenn man „der strikten Führung durch dessen Linearität 
gefolgt ist“ (Ehlich 2007b, 614). 

Viele diagrammatische Transformationen heben die Sequenzialität von 
sprachlichen Äußerungen deshalb zunächst auf. Zwar kann ein Diagramm wie- 
derum Sequenzialitätrepräsentieren, so wie etwa das Diagramm in Abbildung 65, 
das den Prozess der Desequenzialisierung aufzeigen soll: Die Linearität sprachli- 
cher Äußerungen ist durch die aufeinanderfolgenden schwarzen Balken symboli- 
siert und die darunter stehenden, aus ihrer ursprünglichen Sequenz entrissenen 
Einheiten, repräsentieren das neu entstandene, desequenzialisierte Objekt. Inso- 
fern stellt das Diagramm zwar Sequenz dar, aber es wird, da es eben keinen Text 
mehr enthält, dennoch nicht mehr linear gelesen. 


Abb. 65: Desequenzialisierung 


Diagramme sind nicht die prototypischen Bilder, die Ehlich im Zitat oben im Sinn 
hatte. So bewahren Diagramme, die schrift- oder textlastig sind, Sequenzialität, 
was besonders bei Gesprächstranskripten auch konkret gewollt und damit der 
Fall ist. Die diagrammatische Grundfigur der Partitur versucht in vielen Fällen 
natürlich daher gerade Sequenzialität zu bewahren. 

Zudem gibt es Diagramme, die eine eigene Sequenzialität entwickeln. Man 
denke etwa an Flussdiagramme oder generell Diagramme, die eine Form von rich- 
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tungsanzeigenden Elementen, wie etwa Pfeilen, aufweisen, die dann Sequenz 
anzeigen. Trotzdem werden auch solche Diagramme als Bilder gesehen und 
können sprunghaft „gelesen“ werden.°* 

Desequenzialisierung geht mit Rekontextualisierung einher: Die Einheiten, 
die aus ihrer ursprünglichen Sequenz herausgebrochen worden sind, bilden 
ein neues Ensemble und kontextualisieren sich so gegenseitig neu. Die beiden 
Effekte sind deshalb eng ineinander verwoben. 

Der Effekt der Desequenzialisierung ist, wie auch die Rekontextualisierung, 
einerseits ein erwünschter Effekt, um durch diese Transformation eine neue 
Sicht auf die Daten zu gewinnen. Andererseits geht dabei aber eine wichtige 
Information verloren, was je nach Analysezweck von Bedeutung ist. Der Effekt 
der Desequenzialisierung kann zudem auf verschiedenen Ebenen erfolgen. Beim 
Beispiel der KWiC-Liste ist es so, dass die unmittelbare Buchstabensequenz und 
auch die Wortsequenz im gewählten Fenster des dargestellten Kontextes um das 
Suchwort herum unberührt bleiben. Die Information darüber, an welcher Posi- 
tion im Satz und im Text die Wortsequenz zu finden war, verschwindet jedoch. 

Zudem ist für die meisten quantitativ operierenden Transformationen ein 
Effekt der Informationsaggregierung oder -zusammenfassung erwünscht: Ein 
Kollokationsprofil beispielsweise lässt die sequenzielle Ordnung der darin aufge- 
gangenen Einzelbelege zwar verschwinden, fasst das Sequenzverhalten auf Wort- 
ebene jedoch statistisch zusammen, indem etwa die Information vorhanden ist, 
an welcher Position vor oder nach dem Basislexem ein Kollokator normalerweise 
in den Daten erscheint. Damit ist eine aggregierte Sequenzinformation verfügbar. 

Das Problem der Desequenzialisierung ist bei vielen maschinell-quantitati- 
ven Prozessen des Textminings ein ernstes Problem. Viele dieser Verfahren arbei- 
ten mit sogenannten „Bag-of-words“-Ansätzen, d. h., alle laufenden Wortformen 
eines Textes (oder einer anderen Texteinheit) werden bildlich gesprochen in 
einen Sack geworfen, also ihrer Positionsinformation beraubt, und dann weiter 
verarbeitet. Ein Beispiel sind maschinelle Textklassifikationsaufgaben, die über 
Wortfrequenzen in den jeweiligen Texten die Texte klassifizieren (Wiedemann 
2016, 25). Im Natural Language Processing (NLP) begegnet man der Kritik an der 
Desequenzialisierung mit n-Gramm-Ansätzen, also der Wahl von Mehrwortein- 
heiten anstelle von Einzellexemen als Merkmale für die verschiedenen weiteren 
Berechnungen. Aus linguistischer Sicht ist aber klar, dass damit nur die unmittel- 


54 Dies ist selbstverständlich auch bei Text möglich: Man kann sich beliebige Wörter oder Seg- 
mente aus einem Text ‚herauspicken‘, Wörter rückwärts lesen etc., was daran liegt, das Text ge- 
genüber gesprochener Sprache bereits diagrammatische Eigenschaften aufweist. Doch um ihn 
zu rezipieren, muss er linear gelesen werden. 
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bare Sequenz auf Wortebene berücksichtigt wird, die Information der Positionen 
in Texten aber nach wie vor unberücksichtigt bleiben. Je nach Phänomenbereich 
ist das ein unterkomplexer Ansatz, etwa wenn man sich für narrative Struktu- 
ren interessiert. In Kapitel 7 stelle ich eine umfangreichere Studie vor, die das 
Problem der Sequenz im Zusammenhang von narrativen Mustern zu ergründen 
versucht.” 


5.6.3 Dimensionsanreicherung 


Ich hatte mit Krämer schon festgestellt, dass Diagramme Relationen mit grafi- 
schen Mitteln konstituieren (vgl. Abschnitt 2.2). Dafür verantwortlich sind die 
Eigenschaften der Relationalität und Referenzialität: Diagramme, z.B. Balken- 
diagramme, etablieren dabei z.B. ein grafisches System von Relationen, das für 
die Relationen der Balken zueinander und zu numerischen Werten, die diese 
repräsentieren, steht. Damit wurde ein abstrakt-numerisches System in ein räum- 
liches System von Relationen überführt. Ein solches System von Relationen refe- 
riert jedoch auf diagrammexterne Sachverhalte, etwa Frequenzen von Wörtern in 
einem Text, die Sitzverteilung in einem Parlament etc. 


Abb. 66: Dimensionsanreicherung 


Damit wird deutlich, dass Diagramme dafür (mit-)verantwortlich sind, zu Daten 
über Relationen weitere Dimensionen hinzuzufügen. Oft ist es nicht das Dia- 
gramm alleine, das die Dimensionen hinzufügt, weil beispielsweise vorgängig 


55 Es gibt viele Gegenbeispiele zu Bag-of-words-Ansätzen im Textmining und der Computerlin- 
guistik. Ein frühes, linguistisch motiviertes, Beispiel sind die Arbeiten von Biber et al. zu typi- 
schen sprachlichen Merkmalen in wissenschaftlichen Texten in Abhängigkeit ihrer Position in 
den Texten (Biber/Jones 2005). 
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die Daten entsprechend aufbereitet werden. So müssen Bezüge zwischen ver- 
schiedenen Datensätzen, z.B. Namen von Politikerinnen und Politikern mit Par- 
teizugehörigkeiten, schon vor der Visualisierung hergestellt werden. Doch darf 
die durch diagrammeigene Kräfte hinzugefügte Dimensionalität — oder eben das 
konstituierte System von Relationen - nicht unterschätzt werden: Beim Balken- 
diagramm werden durch die grafische Repräsentation der numerischen Werte die 
Balken untereinander räumlich vergleichbar. Das Balkendiagramm zielt ja gerade 
darauf ab, verschiedene Werte durch die diagrammatische Darstellung mitein- 
aner vergleichbar zu machen. 

Wie bedeutend der Einfluss dieser diagrammatischen Verräumlichung und 
Relationierung aber ist, zeigt folgendes Beispiel. Ausgangspunkt sei eine fol- 
gende Zahlenreihe, deren Anfang lautet: 


[ | | 7697223, 47.543327 ], [ 7.769722, 47.553329 |, [ 7.906388, 47.558052 ], | 
7.91361, 47.553886 ], [ 7.918888, 47.552773 ], [ 7.931944, 47.552216 ], [ 8.033333, 
47.556107 ], [ 8.086666, 47.560555 ], [ 8.092222, 47.561661 ], [ 8.099722, 
47.565552 |, [ 8.102499, 47.568329 ], [ 8.103888, 47.571938 ], [ 8.108055, 
47.578331], [ 8.110832, 47.581108 ]... 


Wird die komplette Zahlenreihe als Zahlenpaare auf einer x-Achse und einer 
y-Achse interpretiert und in einem Koordinatensystem abgetragen, ergibt sich 
eine grafische Form (vgl. Abbildung 67). 

Damit wurde es dank der diagrammatischen Transformation möglich, die 
Zahlenpaare um eine Dimension anzureichern, nämlich eine räumliche Veror- 
tung, die wir als Karte und die Punkte darauf (wahrscheinlich) als Umrisse eines 
bestimmten Landes interpretieren können. Dafür war keine nicht-diagrammati- 
sche Vorverarbeitung der Daten nötig — alleine die Anordnung auf einer gerichte- 
ten Fläche erzeugte das Bild und fügte somit den Zahlen eine weitere Dimension 
hinzu. 

Bei sprachlichen Daten ist dieser Effekt insbesondere bei Kartografierun- 
gen oder Netzgraphen unmittelbar deutlich, wo dieser Effekt auch insbesondere 
für explorative Zwecke besonders erwünscht ist. Alle Diagramme weisen qua 
Diagrammatizität zumindest leichte Formen von Dimensionsanreichung auf. 
Darüber hinaus geschieht die Dimensionsanreicherung aber sehr bewusst im 
Zuge der Datenaufbereitung, etwa wenn Korpora annotiert, Gesprächstranskripte 
mit Audio- und Videodaten aligniert, Prozesse repräsentierende Flussdiagramme 
gezeichnet werden etc. Die Trennung, ob nun die Dimensionsanreicherung über 
die eigentliche grafische Umsetzung oder bereits vorher durch nicht-diagramma- 
tische Datenmanipulation geschieht, ist nicht immer einfach, da auch fraglich 
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Abb. 67: Darstellung von Koordinaten auf x- und y-Achsen 


ist, welche Schritte der Datenaufbereitung überhaupt als klar nicht-diagramma- 
tisch betrachtet werden sollen (vgl. dazu Abschnitt 4.1). 


5.6.4 Rematerialisierung 


Die Erstellung von Diagrammen ist, Jäger folgend, ein transkriptives Verfahren, 
mit dem durch (mindestens) eine Transkription sprachliche Daten in ein Dia- 
gramm überführt werden (vgl. Abschnitt 3.1). Die sprachlichen Daten werden aus 
der Optik des gewonnenen Scripts zu einem Präscript und so (neu) lesbar. Die 
Daten rematerialisieren sich als Diagramm, wobei meist im Verlauf der eigentli- 
chen Transkription die typischen medialen Störungen wahrgenommen werden, 
bevor sie dann wieder verschwinden und die Medialität des Diagramms transpa- 
rent wird. 

Mir ist an diesem Punkt wichtig darauf hinzuweisen, dass es sich beim Dia- 
gramm um ein weiteres Script handelt, das den gleichen Bedingungen und dem 
gleichen Potenzial von Interpretation unterworfen ist, wie das Präscript. Theore- 
tisch ist dieser Gedanke einfach zu plausibilisieren und er artikuliert sich in der 


202 — Diagrammatische Grundfiguren 


Praxis mit Feststellungen wie „das Diagramm verstehen“ o.ä. Da im Nicht-Stö- 
rungsfall die Medialität des Diagramms aber transparent ist, fällt es nicht auf als 
Script eines Präscripts, sondern wird als „die Daten“ wahrgenommen - zwar in 
Form eines Diagramms, aber eben als die Daten repräsentierend. Das ist aber ein 
zu einfacher Blick - es handelt sich um ein durch mitunter komplexe Transkrip- 
tionsprozesse entstandenes Script mit eigener medialer Logik und einem daraus 
begründeten Eigenleben (vgl. dazu die Visiotypen im Abschnitt 2.3.4). 

Im geistes- und sozialwissenschaftlichen Kontext müssen deshalb diagram- 
matisch aufbereitete Daten genau so einem Prozess der hermeneutischen Inter- 
pretation unterzogen werden, wie man es mit dem „ursprünglichen Text“, der 
zum Präscript geworden ist, ebenfalls machen würde. Gerade in der Korpuslin- 
guistik, dem Textmining und ähnlichen Gebieten, ist es ist ein großes Missver- 
ständnis, dem sowohl Linguistinnen und Linguisten als auch informatiknähere 
Personen immer wieder verfallen, wenn sie davon ausgehen, dass durch eine 
quantitativ-empirische und maschinelle Textanalyse die Antwort auf eine For- 
schungsfrage gefunden ist. Dies ist nicht der Fall, aber es wurden neue Daten 
gewonnen, oft gerade durch diagrammatische Operationen, die nun weiter tran- 
skribiert und interpretiert werden müssen (vgl. dazu Bubenhofer 2018e). 


5.7 Visualisierungsprinzipien 


Die diagrammatische Grundfigur ist zwar die Grundvoraussetzung, um einen 
neuen Blick auf Daten zu erhalten, aber es sind weitere Schritte nötig: Die Grund- 
figur ist der Ausgangspunkt, um Daten eines bestimmten Datentyps in ein Dia- 
gramm zu transformieren. Mit der Transformation wird in Abhängigkeit der 
Regeln der diagrammatischen Grundfigur ein Mapping von Daten auf grafische 
Zeichen definiert. Etwa bei einem Gesprächsanalysetranskript: Die diagrammati- 
sche Grundfigur ist die Partitur. Die Daten, verschriftlichte gesprochene Sprache, 
wird nach den Regeln der Partitur transformiert. Die Transformation definiert ein 
Mapping von einem Redebeitrag auf eine Sequenz in der Partitur, in Analogie zu 
Takten in einer musikalischen Partitur. 

Die Kombination von diagrammatischer Grundfigur mit einem bestimmten 
Datentyp und bestimmten Transformationsverfahren ergibt damit ein Muster 
oder eine Regelsammlung, das ich „Visualisierungsprinzip“ nennen möchte. 
Nach diesem Prinzip können beliebige ähnliche Daten auf gleiche Weise darge- 
stellt werden, was einer Kanonisierung von Visualisierungen dient. 

Visualisierungsprinzipien regeln jedoch nicht nur Visualisierungen, sondern 
sie eröffnen gleichzeitig einen Möglichkeitsraum für Visualisierungsvariationen 
und -Erweiterungen. Sie ähneln somit einer Allegorie, einem komplexen Sprach- 
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bild, nachdem ein ganzer Bereich strukturiert werden kann. Hat man sich fiir 
ein Visualisierungsprinzip entschieden, ergeben sich eine Reihe von Ausgestal- 
tungsmöglichkeiten. Geht man im Fall des partiturartigen Gesprachstranskripts 
von der musikalischen Partitur als Folie aus, ist es nun plausibel, die Gesprachs- 
teilnehmenden als „Stimmen“ zu verstehen, darunter „führende“ und „Hin- 
tergrundstimmen“ zu unterscheiden, „Einsätze“ zu sehen etc. Zudem können 
Notationsprinzipien der Musik übernommen werden, wie etwa Lautstärke, Tem- 
poangaben oder Pausenzeichen. Weiter ergeben sich mögliche Operationen wie 
Transformationen in Einzelstimmen („Einzelstimmauszüge“) und die gleichen 
Probleme wie bei Musikpartituren, etwa die papiergegebene Raumbegrenzung 
und den dadurch nötig werdenden Umbruch. 

Viele Aspekte innerhalb eines Visualisierungsprinzips müssen für die 
Nutzung der diagrammatischen Darstellung nicht weiter erläutert werden, 
wenn die diagrammatische Grundfigur genügend kanonisiert ist. So muss z.B. 
die Bedeutung der Überlappungen von turns in der Partiturschreibweise von 
Gesprächstranskripten nicht grundsätzlich erläutert werden — wenn das Prinzip 
der Partitur bekannt ist, ist nämlich auch die Überlappung grundsätzlich deutbar. 

Mit einem Visualisierungsprinzip vermischen sich jedoch auch oft verschie- 
dene diagrammatische Grundfiguren und/oder Transformationsprinzipien. Dies 
zeigt die Partiturschreibweise bei Gesprächstranskripten ebenfalls: Notiert werden 
nicht Zeichen für Töne, sondern gesprochene Sprache repräsentierender Text. 

Textualität ist dabei ein eigenes Prinzip, das eigene Regularitäten aufweist 
und nur bedingt mit der Musikpartitur kompatibel ist. Während mit Noten nur 
Tonlänge und -höhe ausgedrückt werden müssen, verwendet Text einem ortho- 
graphischen System gehorchende Buchstabenfolgen zum Ausdruck von Silben 
und Wörtern. Dabei ergeben sich zwar für Musiknoten als auch Text beim Prozess 
der Übertragung in die Partitur grundsätzlich gleiche Probleme: Die grafische 
Ausdehnung des Zeichens stimmt nicht mit der auditiv wahrnehmbaren Länge 
überein. Bei Musiknoten ist dieses Problem jedoch minimal, da das Notenzei- 
chen ausreichend platzsparend ist, so dass der vertikale Raum durch Taktstriche 
und variablem Raum zwischen den Noten reguliert und die Stimmen in exakte 
Übereinstimmung gebracht werden können. Dies ist bei Buchstaben schwieriger; 
man müsste dafür die einzelnen Silben in den einzelnen Stimmen passgenau 
untereinander platzieren und dabei typografische Eingriffe vornehmen, um eine 
exakte Übereinstimmung zu erreichen. Darauf wird normalerweise verzichtet.” 


56 Wenn das nicht der Fall ist, müssen solche Abweichungen der Semantisierung (sind die End- 
positionen von turns zu den anderen turns relational zu verstehen oder nicht?) dann ggf. auch 
für die Benutzung erläutert werden. 
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In der Musik ist fiir die Repräsentation des Stückes sowohl exakter Anfang eines 
Einsatzes in Relation zu den anderen Stimmen als auch deren Ende, sowie alle 
Momente dazwischen relevant. Bei der Gesprächsanalyse ist das normalerweise 
nicht der Fall. So ist bei Überlappungen normalerweise nur die Anfangsposition 
eines turns in Relation zum anderen bedeutsam, nicht aber das Ende des turns, 
das sich nach dem Platzbedarf der Buchstaben des turns richtet. An diesem Punkt 
wird die Differenz zwischen Gesprächspartitur und Musikpartitur deutlich. 

Ein Visualisierungsprinzip eröffnet also immer einen bestimmten Möglich- 
keitsraum für Visualisierungsvariationen und -erweiterungen. Unterschiedliche 
Visualisierungsprinzipien eröffnen jedoch unterschiedlich große Räume, die 
mehr oder weniger Variationen und Erweiterungen zulassen. Ist das Visualisie- 
rungsprinzip dergestalt, dass das Potenzial für Variation und Erweiterung beson- 
ders groß ist, rede ich von einem „reichen“ Visualisierungsprinzip, da es reich 
an potenzieller Variation und Erweiterungen ist. Es eröffnet dann also einen 
besonders großen allegorischen Raum. Auf der anderen Seite existieren „arme“ 
Visualisierungsprinzipien, deren Möglichkeitsraum beschränkt ist. Selbstredend 
sind die Attribute „reich“ und „arm“ kein Maß für Nützlichkeit oder Erfolg von 
Visualisierungsprinzipien. Das Visualisierungsprinzip, das beispielsweise hinter 
Balkendiagrammen steckt, ist vergleichsweise arm, wird jedoch sehr oft und 
sinnvoll angewandt. 

Oft scheinen Visualisierungsprinzipien dann besonders reich zu sein, wenn 
sie unterschiedliche diagrammatische Grundfiguren und/oder Transformationen 
miteinander verbinden. Dies gilt z. B. für thematische Karten: Alleine die geogra- 
fische Karte in allen ihren Varianten, in der unterschiedliche Aspekte der Land- 
schaft eingetragen werden, zeigt das. Dazu kommt die Kombination mit belie- 
bigen anderen Themen, die einen geografischen Bezug haben, und Karten zu 
einem besonders reichen Visualisierungsprinzip machen. Dies ist beispielsweise 
an der Kartentradition in der Linguistik gut sichtbar (vgl. Abschnitt 5.2). 

Als letzten Aspekt zu den Visualisierungsprinzipien können Ludwig Jägers 
Überlegungen zum der Medialität eingeschriebenen Störungs-Prinzip und zur 
Transparenz herangezogen werden (vgl. Abschnitt 3.1). Die Medialität eines Zei- 
chens ist im Normalfall transparent; es wird darüber hinweggesehen, da die 
medialen Aspekte des Zeichens nicht auffallen. Ähnlich verhält es sich mit Dia- 
grammatizität: Wird mit einem Diagramm operiert, ist dessen Diagrammatizität 
transparent. Das Diagramm kann benutzt werden, ohne dessen Diagrammhaftig- 
keit und die damit verbundenen diagrammatischen (und medialen) Eigenschaf- 
ten wahrzunehmen. Wir lesen ein Balkendiagramm als komplexes Zeichen für 
Mengenverhältnisse, nicht als Diagramm, das kraft eines Visualisierungsprinzips 
ein Mapping zwischen grafisch ausgedrückter Höhe von Rechtecken mit Mengen 
herstellt. 
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Eine transparente Diagrammatizität ist jedoch hinderlich für das Ausreizen des 
Möglichkeitsraums eines Visualisierungsprinzips. Dafür muss die Diagramma- 
tizität des Diagramms sichtbar werden, es muss also eine „Störung“ auftreten. 
Das ist auch sofort einsichtig, wenn man an die Momente der Diagrammnut- 
zung denkt, bei denen das Diagramm nicht „funktioniert“: Es ist nicht les- oder 
deutbar, es ist unübersichtlich, unverständlich oder der Bezug zum Gemeinten 
ist unklar. Dann wird das Diagramm in Frage gestellt - in seiner Diagrammati- 
zität - und nicht, indem die Daten oder das damit Bezeichnete problematisiert 
wird. Solche Störungen können dann wiederum der Auslöser dafür sein, den 
Möglichkeitsraum des Visualisierungsprinzips anders auszunutzen oder gar das 
Visualisierungsprinzip grundsätzlich in Frage zu stellen. 

Ein einfaches Beispiel wäre ein Balkendiagramm, bei dem verschiedene 
Datenreihen verglichen werden sollen. Ein einfaches Balkendiagramm stellt die 
Werte einer Datenreihe dar. Möchte man eine zweite Datenreihe integrieren, tritt 
eine „Störung“ auf: Die Diagrammatizität wird zum Thema und es muss eine dem 
Visualisierungsprinzip entsprechende Lösung gefunden werden. So kann für 
eine zweite Datenreihe jedem Balken ein zweiter Balken danebengestellt oder die 
Balken können gestapelt werden. Diese Varianten sind bereits andere Nutzun- 
gen desselben Möglichkeitsraums des Visualisierungsprinzips Balkendiagramm. 
Weiter gäbe es die Option, ein Balkendiagramm dreidimensional darzustellen 
und somit die Balken der weiteren Datenreihen auf einer z-Achse in die räum- 
liche Tiefe zu setzen. Damit wird der Möglichkeitsraum des Prinzips nochmals 
erweitert, indem dem Prinzip Dreidimensionalität hinzugefügt wird. Durch den 
Aspekt der Dreidimensionaliät ergeben sich potenziell weitere Ausweitungen des 
Möglichkeitsraums, etwa indem die Darstellung statt orthogonal perspektivisch 
erfolgt. 

Je nach Datentyp und Datenmenge wird das Visualisierungsprinzip des Bal- 
kendiagramms vielleicht auch ganz grundsätzlich in Frage gestellt. So wird das 
Diagramm bei großen Datenmengen vielleicht unübersichtlich — wieder tritt 
seine Diagrammatizität plötzlich hervor. Oder das Diagramm bildet die Daten 
falsch oder unvollständig ab, etwa weil eine Entwicklung zwischen den einzel- 
nen Datenpunkten der Balken dargestellt werden soll und sich dann ein Linien- 
diagramm besser eignet. 

Störungen, mit denen die Diagrammatizität sichtbar wird, können gezielt 
ausgelöst werden, etwa indem gerade gegen einen Diagramm-Kanon verstoßen 
und ein Visualisierungsprinzip für bestimmte Daten verwendet wird, das der 
Kanon verbietet. Das werde ich in Kapitel 8 tun, wenn ich Gespräche nicht mittels 
Transkriptionen, sondern mit einem anderen Visualisierungsprinzip darstelle. 
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5.8 Von den Grundlagen zu Praktiken 


Nachdem ich nun im ersten Teil des vorliegenden Buches diagrammatische The- 
oriearbeit als Grundlage geschaffen habe, möchte ich im Folgenden zwei längere 
und eine kürzere Fallstudie präsentieren. Diese Fallstudien verfolgen mehrere 
Ziele. Einerseits sollen sie von konkreten linguistischen Fragestellungen ausge- 
hen, für deren Beantwortung Methoden gefunden werden müssen. Es handelt 
sich dabei bei allen drei Fällen um korpuslinguistisch inspirierte Methoden, die 
jedoch davon ausgehen, dass diagrammati-sche Transformationen entscheidend 
sind, um die gewünschten Analysen zu ermöglichen. 

Andererseits geht es bei den drei Fallstudien aber auch darum, die methodo- 
logische Praxis zu reflektie-ren, also den Weg zur Entwicklung eines Analysetools 
als auch die Arbeit damit zu beschreiben und zu analysieren. Allerdings erfüllen 
diese Metabeobachtungen keine ethnographischen Beobachtungsstan-dards, da 
die beobachteten Personen weitgehend mit den Beobachtenden übereinstimmen. 

Die drei Fallstudien nehmen zudem drei unterschiedliche Perspektiven 
auf Sprachgebrauch ein. Die erste, eine Studie zu Geokollokationen, verknüpft 
Sprachgebrauch und Ort (Kapitel 6). Die zweite Studie interessiert sich für nar- 
rative Muster in seriellen Alltagsgeschichten und betont damit Sprachge-brauch 
und Sequenzialität (Kapitel 7). Bei der dritten Studie geht es schließlich um die 
quantitative Visualisierung von gesprochener Sprache; sie thematisiert damit 
also Sprachgebrauch und Interaktion (Kapitel 8). 

Die drei Fallstudien sind weitgehend in Teamarbeit entstanden, allerdings 
in wechselnder Besetzung. Alle insgesamt fünf involvierten Personen vereinen 
linguistische sowie computer- oder korpuslinguisti-sche Hintergründe; es waren 
also keine monodisziplinären Spezialist/innen, z.B. aus den Visual Analy-tics 
oder der Informatik beteiligt, so dass der wissenschaftliche Austausch vor dem 
Hintergrund ähnli-cher fachlicher Verortungen, wenn auch mit unterschied- 
lichen Erfahrungshorizonten, stattfand. Dies bedeutet auch, dass wir bei den 
Fallstudien vergleichsweise unstrukturiert und vor allem informatisch gesehen 
ohne fachspezifische Expertise vorgegangen sind. Das war allerdings auch nicht 
erforderlich, denn es war nicht das Ziel, für die drei Anwendungsfalle je ein Visu- 
alisierungstool zu entwickeln und der wissenschaftlichen Community zur Ver- 
wendung zu übergeben, sondern den Prozess des Suchens und Experimentierens 
eines kleinen linguistischen Forschungsteams nachzubilden, wie es in ähnlicher 
Form wahrscheinlich in vielen linguistischen Projekten existiert. Dieser Prozess 
des Suchens und Experimentierens ist Teil des diagrammatischen Operierens, 
wie auch die Erstellung der Software. 
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6 Sprachgebrauch und Ort 


Karten sind, wie herausgearbeitet wurde, eine wichtige diagrammatische Grund- 
figur in der Linguistik (vgl. dazu Abschnitt 5.2). Sie werden eingesetzt, um 
Sprachdaten in einen geografischen Bezug zu bringen, sei das etwa, indem ein 
bestimmter Sprachgebrauch einen Ortsbezug der Sprecherin indiziert (damit z. B. 
ein Gegenstand der Varietätenlinguistik), oder indem bestimmte Ausdrücke Orte 
denotieren (und damit z.B. ein Untersuchungsgegenstand der Onomastik sind). 
Die Fallstudie zu den Geokollokationen geht von einem diskurslinguistischen 
Forschungsinteresse (Spitzmiiller/Warnke 2011; Bubenhofer 2018a) aus und ver- 
bindet die beiden Perspektiven: Sie zielt auf die Frage, welche diskursiv gepräg- 
ten Konstruktionen von Welt existieren und wie diese untersucht werden können. 
So sind es Diskurse, die bestimmte Assoziationen zu Orten und Regionen prägen. 
Für jemanden aus Deutschland oder Österreich könnten zu den Begriffen Schweiz 
und Griechenland folgende Assoziationen ausgelöst werden: 
— Schweiz: Banken, Schokolade, Steuerhinterziehung 
- Griechenland: Finanzkrise, Urlaub, Flüchtlingskrise 


Toponyme denotieren also nicht nur einen (mehr oder weniger klar) definier- 
ten Ort in der Welt, sondern sind auch mit einer diskursiv geprägten Semantik 
beladen. Diese Semantik ist aber eben abhängig von Diskursen, vom spezifischen 
Sprachgebrauch und damit automatisch auch von den geografischen Standorten, 
aber natürlich auch der sozialen, zeitlichen, thematischen etc. Standorten dieser 
Diskurse, ihrer Verortung. Jemand aus Griechenland oder aus der Schweiz hat 
womöglich andere Assoziationen zum selben Toponym. 

Ziel der Analyse ist nun nicht eine kognitivistische Sicht auf die Assoziatio- 
nen in den Köpfen einzelner Sprecherinnen und Sprecher, sondern die datenge- 
leitete Analyse massenmedialer Diskurse. Dafür entwickelten wir eine einfache 
Operationalisierung des Phänomens diskursiv geprägter Semantik von Topony- 
men, indem wir Kollokatoren zu Toponymen, sogenannten „Geokollokationen, 
berechnen.” 


57 Ergebnisse von Geokollokationsanalysen und auch erste Reflexionen zu den Visualisierun- 
gen dazu veröffentlichten wir bereits an verschiedenen Stellen (Bubenhofer et al. 2019; Buben- 
hofer 2014, 2018d). Die folgenden Ausführungen beruhen zu Teilen darauf, sind aber stark er- 
weitert. 


@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https: //doi.org/10.1515/9783110698732-006 
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6.1 Konzeption Geokollokationen 
6.1.1 Operationalisierung 


Kollokationsprofile sind ein Mittel, die Semantik von Lexemen im Sinne einer 

Wortgebrauchssemantik, wie sie beispielsweise die linguistische Begriffsge- 

schichte vertritt (Busse et al. 1994), zu analysieren (Bubenhofer 2017). Während 

die lexematischen Bestandteile der Kollokationen grundsätzlich nicht einge- 
schränkt sind, beschränken sich Geokollokationen auf Kollokationen, bei denen 
die Basis ein Toponym ist. 

Um die Frage nach einer diskursiv geprägten Weltsicht zu beantworten, 
sollen also alle statistisch signifikanten Kollokatoren zu den Toponymen in einem 
Korpus berechnet werden, wobei das Korpus den gewünschten Diskurs repräsen- 
tieren soll. Die damit verbundene diagrammatische Operation ist die Erstellung 
eines Indizes aller Fundstellen von Toponymen (diagrammatische Grundfigur: 
Liste) und die Überführung der Toponym-Types in den Vektorraum (diagramma- 
tische Grundfigur: Vektor), indem diese durch ihr Kollokationsverhalten definiert 
werden. Da die Toponyme selbst nur sprachliche Zeichen sind, die (mehr oder 
weniger deutlich) auf geografische Orte referieren, kann diese Referenz in einem 
weiteren Schritt aufgelöst werden, indem das Denotat des Toponyms als Georefe- 
renz in Form von Koordinaten auf einer Karte dargestellt wird. Damit findet eine 
weitere diagrammatische Transformation (diagrammatische Grundfigur: Karte) 
statt. 

Für die Analysen wurden verschiedene Datengrundlagen verwendet, die je 
nach Untersuchungsinteresse ausgewählt worden sind. In den folgenden Ausfüh- 
rungen wird von Analysen in diesen zwei Korpora berichtet: 

- Korpus Spiegel/Zeit: Das Korpus umfasst alle in der Zeit von 1946 bis 2016 
erschienenen und in den jeweiligen Online-Archiven der gedruckten Ausga- 
ben verfügbaren Artikel (705’576 Texte, 611 Mio. laufende Wortformen). 

- Korpus Parlamentsprotokolle Bundestag Deutschland: Alle Protokolle der 
Legislatur 2009 bis 2013 des Deutschen Bundestags (363’000 Redebeiträge, 
22 Mio. laufende Wortformen) auf der Basis des Korpus von Andreas Blätte 
(2013). 


Die Korpusdaten sind mit Metadaten ausgezeichnet und mit Wortartklassen 
annotiert sowie lemmatisiert unter Verwendung des TreeTaggers (Schmid 1994). 
Die Wortartklassen-Annotation benutzt die Standardbibliothek für Deutsch des 
Treetaggers und diese folgt dem Stuttgart-Tübingen Tagset (STTS, Schiller et al. 
1995). 
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6.1.2 Assoziationsmaß der Kollokationen und Toponymerkennung 


Fiir die weitere Analyse gilt es nun, die genaue Berechnung der Geokollokationen 
zu definieren und einen Weg zu finden, die Toponyme in den Daten zu finden. 
Was die Kollokationsberechnung angeht, schlagt Evert (2009) verschiedene sta- 
tistische Maße vor, die sich auch für je unterschiedliche Zwecke eignen. Neben 
dem statistischen Maß, das die Assoziationsstärke zwischen den Kollokatoren 
ausdrückt, ist das sogenannte Fenster wichtig, also die maximal erlaubte Spann- 
breite zwischen den Kollokatoren. Während für viele linguistische Fragestellun- 
gen eher enge Fenster im Bereich von drei bis acht Wörtern benutzt werden und 
die Satzgrenze meistens nicht überschritten wird, ist für unsere Zwecke auch ein 
viel größeres Fenster, das maximal der Textlänge entspricht, denkbar. Denn von 
Interesse sind bei einem in einem Text aufgetauchten Toponym grundsätzlich 
alle im selben Text überzufällig häufig auftretenden Lexeme. 

Als Assoziationsmaß verwenden wir Log-Likelihood (Dunning 1993; Evert 
2009, 1235), was als stabiles und gleichzeitig unkompliziert zu berechnendes 
Maß für Kollokationen gilt und in der Diskurslinguistik häufig angewandt wird 
(Bubenhofer 2017). 

Ausgangspunkt für die Berechnung der Kollokationen sind die Toponyme. 
Im Korpus sollen daher mit maschineller Methode alle Toponyme gefunden und 
annotiert werden. Zur Annotation von Toponymen kommen einerseits soge- 
nannte Gazetteer-Verfahren oder kombinierte Verfahren zur Anwendung, die mit 
auf vorannotierten Trainingsdaten erzeugten statistischen Modellen arbeiten. 
Für die Studie wurde der Stanford Named Entity Recognizer (NER) (Finkel et al. 
2005) in einer für das Deutsche adaptierten Version (Faruqui/Padö 2010) verwen- 
det, der mit einem statistischen Modell zur Vorhersage von Toponymen arbeitet. 
Der Recognizer erkennt generell Eigennamen und unterteilt diese in die Klassen, 
wobei für unsere Zwecke nur die Ortsbezeichnungen („LOC“ = Location) berück- 
sichtigt werden. 

Grundsätzlich ist die Klassifikation von Toponymen auch für Menschen nicht 
einfach, da es Übergangsbereiche und Zweifelsfälle gibt. Diese Zweifelsfälle oder 
Übergangsbereiche entstehen etwa bei der Entscheidung, ob eine Nominalgrup- 
pen wie „der höchste Berg Europas“ (Wimmer 1995, 374) oder eine Derivation 
wie „berlinerisch“ als Toponyme aufgefasst werden sollen. Der NER verwendet 
eine enge Definition von „Toponym“. Die berichteten Werte von Evaluationen des 
Parsers liegen bei Zeitungstexten bei F-Werten von knapp unter 80 (Faruqui/Padö 
2010), wobei die Präzision mit 88 Prozentpunkten höher liegt als die Ausbeute 
(72,9). Dies bedeutet, dass es sich bei den erkannten Toponymen bei etwa 88 % 
tatsächlich um Toponyme handelt und der Parser generell etwa 73% aller Topo- 
nyme findet. 
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6.1.3 Georeferenzierung 


In Tabelle 10 ist ein Ausschnitt aus einer so berechneten Liste von Geokolloka- 
tionen abgebildet. Während die Analyse der Liste bezüglich eines bestimmten 
Toponyms, hier z.B. von „Sinai“, sehr gut in dieser Form machbar ist, wird eine 
Analyse über ein paar wenige Toponyme hinaus schwierig. Einerseits nimmt die 
Anzahl der Einträge rasch zu und ist damit weniger gut überblickbar, aber ande- 
rerseits fällt stärker ins Gewicht, dass Bezüge zwischen den Toponymen schwer 
überschaubar werden, da man bei der Analyse unwillkürlich versucht, die Kon- 
zepte der Toponyme geografisch zu verorten. „Yunnan“ und „Sinai“ erscheinen 
in der Liste (je nach Sortierung) benachbart, verweisen aber auf eine Provinz im 
Südwesten Chinas bzw. eine Halbinsel Ägyptens. Um eine Sortierung der Liste 
nach geografischen Zusammenhängen zu ermöglichen, ist deshalb eine Georefe- 
renzierung sinnvoll. 


Tab. 10: Ausschnitt aus einer Liste von Geokollokationen: In der ersten Spalte steht das 
Toponym und in den letzten zwei Spalten der dazugehörige Kollokator mit Wortartklasse. 
Weitere Spalten: „freq“ = absolute Frequenz der Kollokation, „sig“ Signifikanzniveau p 


toponym freq sig collocate pos 
Yunnan 31 0.0001 Provinz NN 
Sinai 27 0.0001 töten VVPP 
Sinai 32 0.0001 werden VAPP 
Sinai 36 0.0001 Al-Arisch NN 
Sinai 23 0.0001 Islamisten NN 
Sinai 54 0.0001 Halbinsel NN 
Sinai 24 0.0001 Mann NN 
Sinai 30 0.0001 öffentlich ADJA 
Sinai 21 0.0001 Al-Arisch ADJD 
Sinai 20 0.0001 Demonstrant NN 
Sinai 39 0.0001 Norden NN 
Sinai 24 0.0001 Polizist NN 
Sinai 25 0.0001 Stadt NN 
Sinai 29 0.0001 agyptisch ADJA 


Sinai 26 0.0001 Extremist NN 
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Tab. 10: (fortgesetzt) 


toponym freq sig collocate pos 
Sinai 30 0.0001 Gebäude NN 
Sinai 36 0.0001 bewaffnet ADJA 
Dominikanische Republik 68 0.0001 Republik NN 
Dominikanische Republik 50 0.0001 Dominikanische NN 
Katar 63 0.0001 Präsident NN 
Katar 56 0.0001 Todesfall NN 
Katar 31 0.0001 Fußball-Bund NN 
Katar 49 0.0001 Menschenrecht NN 
Katar 22 0.0001 Temperatur NN 
Katar 50 0.0001 Turnier NN 
Katar 29 0.0001 geplant ADJA 
Katar 24 0.0001 alarmierend ADJA 
Katar 74 0.0001 international ADJA 
Katar 24 0.0001 Situation NN 


Die Georeferenzierung von Toponymen ist dabei nicht trivial, und zwar aus fol- 
senden Gründen: 


Ambiguität/Homonymität: Obwohl Eigennamen im Unterschied zu Gattungs- 
namen immer auf ein einzelnes Objekt referieren, sind sie nur im Kontext 
disambiguiert und ein Toponym wie „Berlin“ referiert potenziell auf mehrere 
Orte. 

Historizität: Toponyme wie „DDR“ oder „Sowjetunion“ waren nur zu 
bestimmten Zeiten offiziell anerkannte Ortsbezeichnungen. In einem aktu- 
ellen Ortsindex sind sie deshalb nicht mehr aufgeführt. Oder die Referenz 
hat seine Ausmaße verändert, wie etwa „Deutschland“ vor und nach dem 2. 
Weltkrieg. 

Strittigkeit: Toponyme wie „West-Sahara“, „Südossetien“, „Kosovo“ oder 
„Islamischer Staat“ sind keine international anerkannten Gebiete oder 
zumindest nicht als Staaten anerkannte Entitäten, die aber natürlich trotz- 
dem benannt werden, wenn auch der genaue lokale Umfang der Referenz 
umstritten ist. 
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—  Orthographische und sprachliche Variation: Deutlich in historischer, aber 
auch in gegenwartssprachlicher Perspektive variiert die Schreibung von 
Toponymen (,,Milano“ vs. „Mailand“, „Zürich Örlikon“ vs. „Zürich Oerlikon“, 
„Pfannenstiel“ vs. „Pfannenstil“, „Lwiw“ vs. „Lwow“ vs. „JIbBiB“, etc.) und 
es existieren inoffizielle, aber sehr gängige Bezeichnungen („Tschechei“ 
statt „Ischechien“, „Ex-DDR“ etc.) sowie abgekürzte Varianten („China“ statt 
„Volksrepublik China“, „Britannien“ oder „Großbritannien“ statt „Vereinigtes 
Königreich Großbritannien und Nordirland“). 


Die „Geonames“-Ressource”, eine gemeinschaftlich erstellte Liste von Ortsbe- 
zeichnungen weltweit, nennt zu jeder toponymischen Entität eine breite Palette 
an Variation und führt teilweise auch historische Ortsbezeichnungen auf. Es 
kann also als Gazetteer-System verwendet werden, löst jedoch das Ambiguitäts- 
problem nicht. Dafür benutzten wir CLAVIN (Cartographic Location And Vicinity 
INdexer’”), der aufgrund des im Kontext gefundenen weiteren Toponyme eine 
Dis-ambiguierung zu erreichen versucht. Dafür wird einerseits der Ort mit der 
höheren Einwohnerzahl gewählt, sowie Ortsreferenzen bevorzugt, die geogra- 
fisch nahe beieinander liegen. 

Im Ergebnis der Georeferenzierung liegen zu den Toponymen die jeweiligen 
geografischen Koordinaten vor, sowie die in Geonames verfügbaren Angaben wie 
Ortstyp (Staat, Stadt, Gemeinde etc.), Populationsgröße, Staatszugehörigkeit etc. 
Allerdings sind nur Punktreferenzen, keine Flächen verfügbar, was wir in einem 
weiteren Schritt zumindest für Staaten noch hinzugefügt haben. 


6.1.4 Vorläuferversionen und Genese 


Die Genese dieser Operationalisierung ist jedoch Ergebnis einer mehrjährigen 
Entwicklungsgeschichte. Ausgangspunkt waren meine Überlegungen vor dem 
Hintergrund eines ganz bestimmten Korpus, dem Text+Berg-Korpus (Bubenho- 
fer et al. 2015b), einer Sammlung von alpinistischen Texten des „Jahrbuch des 
Schweizer Alpenclubs“ und der „Alpen“ von 1864 bis in die Gegenwart. In diesen 
Texten ist geografische Lokalisierung allgegenwärtig, allerdings meistens in viel 
lokalerer Ausprägung als bei der oben skizzierten Forschungsfrage nach diskur- 
siv geprägten Weltsichten. Aber auch da war die Frage nach dem Sprechen über 
Landschaft Motivator, eine korpuslinguistische Antwort darauf zu finden. Um 


58 Vgl. www.geonames.org (letzter Zugriff: 22.9. 2020). 
59 Vgl. https://github.com/Berico-Technologies/CLAVIN/ (letzter Zugriff: 22.9. 2020). 
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dies auszuprobieren, begann ich ein Script in der Programmiersprache Perl zu 
verfassen. Eigentlich würde man sich zunächst ein klares Konzept der zu lösen- 
den programmiertechnischen Aufgabe erstellen, bevor die Programmierung 
beginnt. Scriptsprachen sind jedoch dazu geeignet, mit dem Gestus eines Lesers 
an Texte heranzugehen und die selben Operationen, die man als Leser mental 
oder mit Hilfe von Papier und Stift oder Exceltabelle vornehmen würde, maschi- 
nell durchzuführen - und das sofort ohne größere Planung (vgl. dazu Abschnitt 
4.4.2). Ich habe mir jedoch angewöhnt, zu Beginn eines Scripts dessen geplante 
Aufgabe in zwei, drei Sätzen zu notieren. In Tabelle 11 (s. u., S. 216) ist der Kopf 
des Scripts, das ich „geoLinguistics“ taufte, aufgeführt.‘ 

Das Script funktioniert zunächst also zur Erstellung eines einfachen Index, 
bei dem Toponymen Wörter zugeordnet werden, die im selben Satz erscheinen 
und diese zusätzlich gezählt werden. Ausgegeben wird dann eine XML-Datei 
dieses Indexes, die anschließend über eine HTML-Datei auf einer Karte visuali- 
siert wird. Diese Visualisierung wiederum ist eine angepasste Version einer bereits 
in Bubenhofer (2009, 276-277) verwendeten Visualisierung ähnlicher Daten, bei 
der ich die Anzahl von Nennungen von „Staaten, Hauptstädten und Einwohner/ 
innen im NZZ-Korpus“ in Form von Datenpunkten auf Karten darstellte. Anstelle 
von Datenpunkten werden jedoch direkt die zu einem Toponym gehörenden 
Wörter am entsprechenden Ort dargestellt (vgl. Abbildung 68, S. 217). 

Die Darstellung verwendet „Google Maps“ und die entsprechende API als 
Grundlage und ist mit Javascript realisiert. Diese Visualisierung ist offensicht- 
lich nicht dafür gedacht, gezeigt zu werden, ist doch z.B. das Fenster mit Codes 
zum Debugging des Scripts dargestellt und befriedigt die Visualisierung gene- 
rell nicht. Diese Vorarbeiten waren jedoch wichtige experimentelle Schritte hin 
zu einem verfeinerten Konzept von „Geokollokationen“, wie ich im Folgenden 
zeigen werde. Die Vorarbeiten veranschaulichen zudem den Einfluss techni- 
scher Umgebungen auf die Experimentierpraxis: Das wenige Zeilen enthaltende 
Perl-Script zur Berechnung der Wortfrequenzen zeigt noch Spuren des Herantas- 
tens an bessere Lösungen; mit der Zeit umfasste es über 600 Zeilen Code, der in 
diesem Zustand jedoch fern eines systematisch strukturierten Scripts ist, sondern 
auskommentierte Codeteile, Testzeilen und unsystematische Zwischenkommen- 


60 Bemerkenswert ist, dass in der Programmierung von „lesen“ bzw. „read“ (und „schrei- 
ben“ — „write“) von Daten die Rede ist, auch wenn es sich nicht um Textdaten handelt. Auch in 
meiner Beschreibung ist mit „liest mit Geo-Informationen annotierte Textdateien...“ von Lesen 
die Rede und es wird deutlich geschildert, was pro Satz, der gelesen wird, getan werden soll. 
Dies zeigt einmal mehr, wie wichtig Text und das Schreiben (und Lesen) von Daten in der Kon- 
zeptualisierung des Computers ist, wie ich bereits in Abschnitt 4.2 und den Ausführungen zum 
Computer als Schreibmaschine erläuterte. 
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Tab. 11: Ausschnitt Perlscript „geoLinguistics.pl“: Kopf der Datei mit Aufgabenstellung und 
Versionsänderungen 


# geoLinguistics.pl 

# Erstellt: 7. Oktober 2010, Noah Bubenhofer 

# Beschreibung: Liest mit Geo-Informationen annotierte Textdateien und extrahiert 

# aus jedem Satz, in dem eine Geoinformation vorhanden ist, die Wörter einer gewünschten 
# Wortklasse und produziert eine XML-Datei, die mit karte.html geladen werden kann. 

# karte.html stellt pro Geopunkt dann die frequentesten Wörter auf einer Karte dar 

# Version 1.1: 

# - neue Option --geodata 

# - Anpassung an Release 145 

# - Bugfixes 


# Version 1.2: 
# - Bugfixes 


# Version 1.3: 


+ 


- Integration der Gazetteer-Lib. 


# Version 1.4: 
# - StartEnd-Tag als Parameter 


# - --geodata kann jetzt mit XML und CSV-Dateien umgehen 

# Verison 1.5: 

# - Unabhängig gemacht von einer vorkommenden ID des Geotags 

# wie im Text+Berg-Korpus üblich. Achtung: Jetzt werden diese 
# aber auch nicht mehr beachtet, wenn sie verfügbar sind! 


# Version 1.6: 
# - Neues Korpusformat --geoid möglich. 


+ 


Version 1.61: 
# - bei Verwendung von --geonamesid wird die Länderangabe aus der ursprünglichen 
#  Korpusannotation <toponym_country> verwendet statt aus GeoNames. 


tare enthält. Scriptsprachen und vor allem die damit verbundene Coding Cultu- 
res, die Experimentierfreudigkeit begünstigen (vgl. Abschnitt 4.4.2), lassen ein 
solches Vorgehen zu. 

Die Visualisierung basiert zudem auf Ideen und Code einer älteren Anwen- 
dung. Die dafür nötige HTML-Datei und der JavaScript-Code können direkt 
angepasst werden, um schnell erste Visualisierungsideen auszuprobieren. Der 
JavaScript-Code ist zudem durchsetzt mit Codeschnipseln von fremden Scrip- 
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© 2008 Noah Bubenhofer 


Abb. 68: Vorversion einer Darstellung von Wörtern in der Umgebung von Toponymen 


ten, die von im Web verfügbaren Tutorials oder Beispielscripten kopiert worden 
sind. Das gesamte Script stellt also eine Collage von altem, neu angepasstem und 
fremdem Code dar. Mit der Verwendung der Google-API für die Kartendarstellung 
schreibt man sich zudem in die Coding Culture der Webservices ein, bei der die 
am Ende sichtbare Visualisierung eine Mischung von selbst- und fremdbestimm- 
ten Elementen darstellt. So kann die grafische Darstellung der Karte beispiels- 
weise nur minimal beeinflusst werden und man ist abhängig von den Vorgaben 
der Firma Google und deren kommerziellen Interessen. 
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6.2 Visualisierung 
6.2.1 Vorüberlegungen 


Wie oben in Abschnitt 6.1.1 beschrieben, sind bei der Berechnung von Geokol- 

lokationen mehrere diagrammatische Transformationen beteiligt: Vom Text zur 

Liste, zum Vektorraum und zur Karte. Alle diese Repräsentationsformen haben 

das Potenzial, auch grafisch visualisiert zu werden. Insbesondere könnten die 

Positionen der Toponyme zueinander im Vektorraum in einem auf zwei oder drei 

Dimensionen reduzierten grafischen Raum visualisiert werden: Die Toponyme 

können durch die Berechnung der Kollokationsprofile als Vektor repräsentiert 

werden. Die Vektoren von Toponymen, die in ähnlichen Kontexten verwendet 
werden, ähneln sich dann insofern, als dass die geometrische Distanz zwischen 
ihnen klein ist. Abbildung 69 zeigt ein Dendrogramm einer solchen Clusterbe- 
rechnung, mit der die Ähnlichkeit von Toponymen aufgrund ihrer Kollokations- 
profile berechnet worden sind. Die Toponyme ähneln den anderen Toponymen je 
nach Position im Dendrogramm. So bilden etwa die Länder USA, Japan, Indien, 

Russland, Amerika, Frankreich, China, Israel und Afghanistan ein Cluster auf 

der einen Seite des Baumes (in der Abbildung oben, vergrössert), einige Bundes- 

länder Deutschlands sowie Karlsruhe ein anderes (in der Abbildung unten). Das 

Diagramm zeigt, dass Elemente einer diskursiv konstruierten Welt auch gänzlich 

ohne geografische Kartendarstellungen erfolgen kann und sich dabei gerade die 

Chance ergibt, die Ähnlichkeit der Toponyme losgelöst von ihrer geografischen 

Verortung zu interpretieren. 

Die oben (Abschnitt 6.1.4) geschilderte Genese der Idee der Geokollokatio- 
nen zeigt aber deutlich, dass die Repräsentation der Geokollokatoren im geogra- 
fischen Raum von Beginn an dominant war. Nicht zuletzt liegt das auch daran, 
dass bereits Code zur Darstellung von Datenpunkten aufeiner Google Maps-Karte 
zur Verfügung stand. Die darauf basierende experimentelle Darstellung der Geo- 
kollokatoren befriedigte jedoch nicht (vgl. Abbildung 68), vor allem deswegen, 
weil die Parametrisierung der über die Google API erstellten Karte zu wenig frei 
ist und die Darstellung nur beschränkt den eigenen Vorstellungen entsprechend 
angepasst werden kann. Deshalb musste das enge Korsett der technischen Mög- 
lichkeiten gesprengt werden. 

Die Wünsche an eine verbesserte Darstellung waren demnach: 

1. Die Geokollokationen als Ausdruck einer diskursiven Prägung von Welt 
sollen als eigene kartografisch darstellbare Informationsebene aufgefasst 
werden. Dies ergibt sich aus der Idee, dass die diskursiv geprägte Weltsicht 
ein Analogon zur geografischen Ebene darstellt und sozusagen strukturell 
an sie gekoppelt ist. Damit muss sich diese Ebene der gleichen diagramma- 
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Abb. 69: Dendrogramm einer Clusterberechnung von Toponymen aufgrund ihrer Kollokations- 
profile: Toponyme, die im Dendrogramm dem gleichen Zweig angehören, haben ähnliche 
Kollokationsprofile (Datengrundlage: Korpus Zeit/Spiegel 2010-2016, Kollokatoren mit p <= 
0.0001 und Mindestfrequenz 11, 15’600 Kollokatoren, Clustering ward, euklidische Distanz) 


tischen Grundfigur bedienen wie die Karte selbst, das bedeutet, sich dem 
Koordinatensystem der Karte, also deren Gerichtetheit sowie deren Relatio- 
nalität und Referenzialität (vgl. Abschnitt 2.2) unterzuordnen. 
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2. Da die Kollokationsprofile bereits eine mehrstufige Transformation von Text 
darstellt und als Repräsentationselement von Diskurs aufgefasst werden soll, 
soll die Visualisierung zunächst auf weitere Transformationen verzichten 
und die Geokollokatoren direkt in Textform anzeigen. Denkbar wäre ja, nicht 
Text, sondern die Kollokationsprofile und die damit verbundenen Vekto- 
ren abstrakt auf der Karte darzustellen. Dies könnte beispielsweise dadurch 
geschehen, dass die Position der Vektoren im Vektorraum in einem farbli- 
chen Kontinuum codiert ist und dann die Toponyme auf der Karte entspre- 
chend eingefärbt würden; ähnlich eingefärbte Toponyme würden dann Nähe 
im Vektorraum und damit ähnliche semantische Prägung der Toponyme 
bedeuten. Damit ginge aber ein direkter Zugriff auf die Inhalte der Vektoren 
verloren. Wir versuchten aber im letzten Schritt der Visualisierungsexperi- 
mente diese Sicht auch noch zu integrieren (dazu vgl. Abschnitt 6.2.3). 

3. Die interne Ordnung des Kollokationsprofils soll grafisch codiert werden: Als 
interne Ordnungsmöglichkeiten können absolute oder relative Frequenz des 
Kollokators dienen, mit der er zusammen mit dem Toponym erscheint oder 
aber das Assoziationsmaß der Kollokation. Natürlich sind weitere Ordnungs- 
kriterien denkbar wie alphabetische Ordnung, Ordnung nach Wortartklassen 
etc. oder Kombinationen davon. 

4. Die Visualisierung soll verschiedene Filtermöglichkeiten zulassen, um den 
Datensatz in unterschiedlichem Umfang darzustellen. 

5. Der Nachteil der direkten Anzeige der Geokollokatoren als Text (vgl. Punkt 2 
oben) liegt natürlich darin, dass Ähnlichkeiten zwischen den Kollokations- 
profilen nicht auf den ersten Blick sichtbar sind. Dabei ist aber schon auf 
Wortebene schnell sichtbar, dass bestimmte Kollokatoren bei vielen Profi- 
len erscheinen, also sozusagen „global“ verwendet werden, andere sich auf 
einen oder wenige Profile beschränken und damit „lokal“, also spezifisch für 
bestimmte Orte, sind. Diese Verbreitungstypen der Kollokatoren soll darstell- 
bar sein. 


Die technischen Beschränkungen der bisherigen Lösung machten es somit not- 
wendig, andere Lösungen zu finden, die ich im Folgenden zeige. 


6.2.2 Statische Visualisierungen 


Die im vorherigen Abschnitt genannten Vorüberlegungen und Bedingungen für 
die Visualisierung der Daten suggerieren ein strukturiertes Vorgehen: Planung 
gefolgt von Implementierung. Dies entspricht aber nicht der Realität. Stattdessen 
bestanden die ersten Schritte darin, die Möglichkeiten der Programmiersprache 
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R für die Darstellung von Karten zu evaluieren und damit zu experimentieren. Die 
Wahl fiel auf R aufgrund der ausgebauten Möglichkeiten der Datenmanipulation 
und statistischen Analyse, gepaart mit grafischer Ausgabe. 

Als Grundlage für die Kartendarstellung in R diente das „World Borders 
Dataset“°!, das die Umrisse aller Länder der Welt als Polygone enthält. Mit dem 
Paket „rgdal“‘ von Roger Bivand et al. kann dieses Dataset verarbeitet und dar- 
gestellt werden. Um die Geokollokationen darzustellen, wurde die Liste als Wort- 
wolke aufgefasst und das Paket ,,wordcloud*® von Ian Fellows verwendet. Damit 
folgt die Anordnung der Kollokatoren einer eigenen diagrammatischen Logik, die 
das Ziel verfolgt, die Wörter nicht überlappend auf der Fläche zu verteilen, wobei 
Größe und Farbe jedes Wortes festgelegt werden können. Die Wortwolke wird an 
der Position des georeferenzierten Toponyms auf der Karte platziert. Abbildun- 
gen 70 und 71 zeigen die so produzierten Karten, allerdings bereits mit weiteren 
grafischen Elementen. 
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Abb. 70: Ausschnitt aus einer mit R produzierten Karte von Geokollokationen (Korpus: 
Bundestag WP 17, CDU/CSU-Fraktion) 


61 Vgl. http://thematicmapping.org/downloads/world_borders.php (letzter Zugriff: 22. 9.2020). 
62 Vgl. https: //cran.r-project.org/package=rgdal (letzter Zugriff: 22. 9. 2020). 

63 Vgl. https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf (letzter Zugriff: 
22.9.2020). 
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Wie bereits zu den Coding Cultures ausgeführt (vgl. Abschnitt 4.4.2), ist auch R 
dadurch gekennzeichnet, ein Arbeitsinstrument zu sein, wo Programmierung und 
Anwendung ineinander greifen. Auch das gut 400 Zeilen umfassende R-Script ist 
geprägt von auskommentierten Zeilen und Kommentaren, die vom Experimen- 
tieren mit verschiedenen Varianten zeugen. Die beiden Abbildungen 70 und 71 
zeigen Varianten, bei denen Kollokatoren bestimmter semantischer Klassen farb- 
lich markiert sind. Für sie semantische Klassifizierung wurden Dornseiff-Katego- 
rien verwendet (Dornseiff 2004), also Sachgruppenbezeichnungen wie „Krieg“, 
„Streit“, „Kampf“ etc. (rot) oder „Politik“, „Regierung“, „Wahl“ etc. (blau). Über 
einen Abgleich mit den Sachgruppen wurden die Kollokatoren automatisch zuge- 
ordnet, wobei Kollokatoren mehreren Sachgruppen angehören können. 


Geocolocations Bundestag Wahlperiode 17 (2009-2013): DIE LINKE 


Abb. 71: Vollansicht einer mit R produzierten Karte mit Geokollokationen (Korpus: Bundestag 
WP 17, Fraktion Die Linke) 


Eine andere Weiterentwicklung betrifft das Berechnen von „globalen“ und 
„lokalen“ Kollokatoren. Globale Kollokatoren sind solche, die über weite Teile 
der Erde streuen, lokale, die nur an einem bestimmten Ort verwendet werden. Um 
ein Maß für die Globalität und Lokalität zu erhalten, wurden die Koordinaten der 
jeweiligen zum Kollokator gehörenden georeferenzierten Toponyme in aufstei- 
sender Reihenfolge geordnet und dann die euklidischen Distanzen dazwischen 
aufsummiert. Je größer die euklidische Distanz, desto globaler wird der Kolloka- 
tor verwendet. 
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In Abbildung 71 sind auf der linken Seite Listen der globalsten und lokalsten Kol- 

lokatoren sichtbar. Da die Listen in der Abbildung wegen der Verkleinerung nicht 

lesbar sind, seien hier die jeweils ersten zwölf genannt: 

- Globale Kollokatoren: Land, Staat, deutsch, europäisch, Mensch, Million, 
Euro, Prozent, Bundesregierung, Beispiel, Waffe, Krieg 

- Lokale Kollokatoren (in Klammer häufigstes assoziiertes Toponym): ver- 
einigt (USA), Vertrag (Lissabon)™, Universität (Heidelberg), Entscheidung 
(Karlsruhe)®, Putsch (Honduras), Anschlag (New York), Fall (Senegal), Kin- 
dersoldat (Uganda), Schwerpunkt (Senegal), September (Kunduz)“, Winter- 
spiel (Sotschi), Friedrich-Naumann-Stiftung (Honduras) 


Im R-Code können bestimmte Kollokator-Types bestimmt werden, die bei der 
Visualisierung mit Kanten verbunden werden, um ihre globale Verbreitung zu 
sehen. 

Eine Schwierigkeit der so entstandenen Darstellung ist die ungleiche Vertei- 
lung der Kollokatoren über die Welt. Je nach Korpus kommt es zu Schwerpunkten; 
so werden in den meisten Korpora deutschsprachiger Texte (Zeitungen, Bundes- 
tagsprotokolle etc.) häufiger Toponyme in Europa und besonders Deutschland 
genannt, was zu unleserlichen Darstellungen in diesen Regionen führt. Deshalb 
kann im R-Code ein geografischer Bereich definiert werden, der aus der Über- 
sichtsdarstellung ausgesondert und vergrößert dargestellt werden soll. 

Solche Probleme verdeutlichen natürlich die Schwierigkeiten einer stati- 
schen Darstellung. Die mit dem R-Code entstehenden Visualisierungen, im SVG- 
oder PDF-Format abgespeichert, werden sehr groß und unhandlich. Für eine 
damals entstandene Publikation (Bubenhofer 2014) erstellte ich als Ergänzung 
eine Website, die eine größere Auswahl an Darstellungen, zudem in Farbe, auf- 
führte, die im Zeitschriftenartikel nicht abgedruckt werden konnten.‘® 


64 Zurückgehend auf den „Vertrag von Lissabon zur Änderung des Vertrags über die Europäi- 
sche Union und des Vertrags zur Gründung der Europäischen Gemeinschaft“ von 2007, der 2009 
in Kraft trat. 

65 Zurückgehend auf Entscheidungen des Bundesverfassungsgerichts in Karlsruhe. 

66 Diese Verbindung geht auf den am 4.11.2009 von einem deutschen Oberst angeforderten 
und US-Streitkräften ausgeführten Luftangriff auf zwei Tanklastwagen zurück, bei dem eine 
große Zahl ziviler Opfer entstanden und was zu politischen Debatten in Deutschland führte. 

67 Diese Verbindung geht darauf zurück, dass 2009 die Stiftung Verständnis für einen Putsch 
in Honduras zeigte; vgl. Tagesspiegel (14.8.2009): „Friedrich-Naumann-Stiftung rechtfertigt 
Putsch in Honduras“; http://www.tagesspiegel.de/politik/staatsstreich-friedrich-naumann-stif- 
tung-rechtfertigt-putsch-in-honduras/1579132.html (letzter Zugriff: 22.9. 2020). 

68 Vgl. http://www.bubenhofer.com/geocollocations/ (letzter Zugriff: 22.9. 2020). 
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Das Ziel der dynamischeren Visualisierung sollte sein, die Interaktion mit der 
Karte zu vereinfachen. Im Prinzip ist auch die sogenannt „statische“ Version 
hochgradig interaktiv, da mit den verschiedenen R-Code-Schritten, die ausgelöst 
werden, die Datenaufbereitung und Darstellung weitgehend beeinflusst werden 
kann. Denn die Visualisierung ist ja streng genommen nicht bloß diein Abbildung 
71 gezeigte Karte, sondern die Kombination aus R-Script und Karte, wobei für die 
Arbeit mit einem R-Script oft eine Softwareumgebung wie „RStudio“‘? verwendet 
wird, die als Arbeitsbank angesehen werden kann und die Programmierung und 
Analyse vereint (vgl. Abbildung 72). Die Arbeit mit einer solchen Umgebung hat 
den Vorteil, dass sie eine White Box darstellt, bei der (im Prinzip, wenn der Code 
verstanden wird) alle Schritte transparent sind. 


SSSISEEREBRERERSEEEE © 


Abb. 72: Die Arbeit mit einem R-Script in R-Studio 


Allerdings dauert ein Durchlauf durch das ganze Script pro Karte ungefähr 
eine Minute - egal welches Detail der Darstellung geändert wird. Daher ist der 
Wunsch nach einer Umgebung, mit der schneller mit der Visualisierung inter- 
agiert werden kann, sinnvoll und verständlich. 


69 Vgl. https: //www.rstudio.com/ (letzter Zugriff: 22.9. 2020). 
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6.2.3 Dynamische Visualisierungen 


Es ist inzwischen problemlos möglich, mit R interaktive Web-Anwendungen 
zu erstellen, so etwa mit „Shiny“ von RStudio. Die Firma RStudio wurde 2008 
gegründet, die Software RStudio 2011 erstmals veröffentlicht.” Shiny wiederum 
muss Ende 2012 erschienen sein.” Fast zwei Jahre vorher erschien die Javascript- 
Bibliothek „D3.js“ erstmals (Bostock et al. 2011), die explizit dafür gemacht ist, 
interaktiv und dynamisch Daten im Webbrowser zu visualisieren. Mit R und 
Javascript/Webtechnologien stehen also auch zwei unterschiedliche Coding 
Cultures einander gegenüber, wobei sich R mit Entwicklungen wie Shiny an 
die Javascript/Webtechnologien-Kultur annähert (da Shiny ebenfalls Javascript 
benutzt und im Browser funktioniert). Um einen Eindruck der Popularität der 
beiden Technologien zu erhalten, sind in Abbildung 73 „Google Suchtrends“ von 
drei einschlägigen Suchabfragen aufgeführt. Man sieht dort, dass Suchanfragen 
nach „d3.js“ ab Mitte 2011 stark ansteigen und sich Anfang 2014 auf hohem Niveau 
stabilisieren. Anfragen nach „r shiny“ steigen erst ab Ende 2012 kontinuierlich an 
und überflügeln aber die Suchen nach „d3.js“ erst Anfang 2017. Damit einher geht 
eine Zunahme der Suchen nach „r programming“, also zu R generell.’? 


70 Vgl. https: //www.rstudio.com/about/ (letzter Zugriff: 22.9. 2020). 

71 Es ist schwierig, das Geburtsdatum der Software zu bestimmen. Auf GitHub, der Plattform, 
wo der Code gelagert wird, datieren die ersten „Issue Requests“ von November 2012 (https:// 
github.com/rstudio/shiny/issues?q=is%3Aissue+is%3Aopen+sort%3Acreated-asc). In der für 
Programmierprobleme beliebten Plattform „stackoverflow“ datiert die erste Frage dazu auch 
vom 9. November 2012 (https://stackoverflow.com/questions/13313503/r-studio-shiny-conditio- 
nal-statements). In den offiziellen Release Notes von Shiny sind keine Daten angegeben (https: // 
shiny.rstudio.com/reference/shiny/0.11/upgrade.html). (Alle URLs zuletzt am 22.9.2020 ge- 
prüft.) 

72 Relativierend muss jedoch betont werden, dass die Berechnungsmethode von Google hinter 
diesen Suchtrends unbekannt ist. Zum Maß der Trends, „Interessen im zeitlichen Verlauf“ ge- 
nannt, schreibt Google: „Die Werte geben das Suchinteresse relativ zum höchsten Punkt im Dia- 
gramm für die ausgewählte Region im festgelegten Zeitraum an. Der Wert 100 steht für die höchs- 
te Beliebtheit dieses Suchbegriffs. Der Wert 50 bedeutet, dass der Begriff halb so beliebt war und 
der Wert 0 entspricht einer Beliebtheit von weniger als 1% im Vergleich zum Höchstwert“ (vgl. 
https://trends.google.de/, letzter Zugriff: 24.11.2017). Diese Erklärung ist ungenügend, um die 
Werte richtig interpretieren zu können, zumal sie auch nichts über das Verhältnis der Werte für 
die einzelnen Suchbegriffe zueinander aussagt. 
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Abb. 73: Google Suchtrends für die angegebenen Suchbegriffe (vgl. https://trends.google.de); 
Suchinteresse in Prozent in Relation zum höchsten Wert 


Dies bedeutet, dass noch 2015, als wir nach technischen Möglichkeiten einer 

interaktiveren Version der Geokollokationen suchten, D3.js wahrscheinlich die 

populärere Bibliothek war als Shiny. Heute, 2017, wäre der Schritt von der stati- 
schen R-Version zu einer interaktiveren mit Shiny oder einer ähnlichen Bibliothek 
ebenfalls naheliegend. 

Ausgangspunkt für die erste D3.js-Version der Geokollokationen-Visualisie- 
rung waren einerseits die eigenen Vorarbeiten, andererseits verschiedene Bei- 
spiele für Kartenvisualisierungen mit D3 in der Community. Abbildung 74 zeigt 
eine Ansicht der Visualisierung. 

Neu mit dieser Version gibt es als Ergänzung zur zoom- und verschiebbaren 
Kartendarstellung ein Bedienfeld, um die Darstellung zu beeinflussen. Folgende 
Auswahlmöglichkeiten stehen zur Verfügung: 

— Auswahl der darzustellenden Wortklassen der Kollokatoren: Alle, Nomen, 
Adjektive, Verben, andere. 

- Aggregation der Daten: Grundeinstellung nach Ort (jeder georeferenzierte 
Toponym-Type stellt einen eigenen Ort auf der Karte dar), Zusammenfassung 
nach Staaten (Kollokatoren zu Orten im selben Staat werden aggregiert). 

—  Dornseiff-Sachgruppen: Eine Liste nennt alle Sachgruppen, die durch Kol- 
lokatoren auf der Karte vertreten sind, inkl. der Anzahl der Vertreter. Ein 
Auswahl von Sachgruppen reduziert die Anzeige der Kollokatoren auf die 
jeweiligen Vertreter der Sachgruppen. 

- Signifikanzniveau: Auswahl des Signifikanz-Schwellwerts der Assoziations- 
stärke, ab der die Kollokatoren angezeigt werden sollen. 
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Abb. 74: Webinterface Geokollokationen Version 1: Ubersicht 


—  Kollokatorfrequenzen: Auswahl der absoluten Mindestfrequenz der Geokol- 
lokation und Beschränkungsmöglichkeit auf die x häufigsten Kollokatoren 
pro Ort. 

—  Kollokator Suchzeichenkette: Auswahl von Kollokatoren, die auf einen Such- 
ausdruck (Syntax „Reguläre Ausdrücke“) passen. 

-  Darstellungsarten der Kollokatoren: Alternative Darstellungsweisen der Kol- 
lokatoren (vgl. dazu die folgenden Ausführungen). 

— Datenauswahl: Auswahl des Korpus. 


Mit den verschiedenen Auswahlmöglichkeiten bewegt sich die Visualisierung 
stärker hin zu einem explorativen Werkzeug. Eine offene Frage blieb aber immer 
noch die Darstellung der Kollokatoren auf der Karte. Die Darstellung nach dem 
Muster von Wortwolken, wie in der statischen Visualisierung (vgl. Abschnitt 
6.2.2) scheiterte aus technischen Gründen, da dafür keine einfache algorithmi- 
sche Lösung gefunden werden konnte.” Allerdings befriedigte sie auch nicht 
vollends, da die Position der Kollokatoren innerhalb der Wortwolke nicht seman- 
tisiert und damit der Vorteil gegenüber einer Liste unklar ist. 


73 Selbstverständlich ist es mit Javascript und D3 möglich, eine solche Darstellung zu imple- 
mentieren. Da ich jedoch in akzeptabler Frist keine Lösung fand, gab ich die Suche danach auf. 
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Zudem stellt sich natürlich die Frage, ob die Kollokatoren überhaupt einzeln auf 
der Karte dargestellt werden sollen, zumal fiir bestimmte Anwendungen gerade 
eine abstrahierte Sicht auf die Daten relevanter ist: Nicht die einzelnen Kolloka- 
toren sind dann interessant, sondern deren Zusammenfassung. 

So implementierte ich vier verschiedene Darstellungsweisen der Kollokato- 
ren in die Visualisierung, wovon Abbildung 75 zwei zeigt. Anstelle von Wortwol- 
ken werden Listen verwendet, die die Kollokatoren nach Wortartklasse (zusätz- 
lich farbcodiert) und danach alphabetisch geordnet auffiihrten. Sie werden mit 
dem entsprechenden Toponym übertitelt. Geografischer Ankerpunkt der Listen 
ist die obere linke Ecke. 


Abb. 75: Darstellung der Kollokatoren als Listen oder Punkte 


Wie bereits Abbildung 76 zeigt, ist das Problem dieser Listen deren Positionie- 
rung in dichten Bereichen, wo es zu starken Uberlappungen kommt und die 
Listen unleserlich werden. Sie zeigen in solchen Bereichen zwar noch Dichte an, 
erfüllen ihren Zweck jedoch nicht mehr vollständig. Als Alternative bietet sich 
eine Punktdarstellung an (vgl. Abbildung 75, rechte Seite), wobei jeder Punkt fiir 
einen Kollokator steht und sie in einem Raster von maximal zehn Punkten Breite 
und beliebiger Höhe angeordnet werden. Die Farbgebung codiert wiederum die 
Wortartklassen-Zugehörigkeit. Auch hier kann es zu Überlappungen kommen, 
jedoch nicht mehr zu so gravierenden, wie bei den Listen. 
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Abb. 76: Geokollokationen Version 1: Auswahl von Kollokatoren, die eine der folgenden 
Zeichenketten enthalten: geld, wirtschaft, bank, finanz 


Je nach Forschungsinteresse interessieren bestimmte thematisch definierte Dis- 
kurse. Abbildung 76 zeigt ein Beispiel für die Beschränkung der Darstellung auf 
Kollokatoren, die einen Wirtschafts- und Finanzdiskurs repräsentieren sollen. 
Interessant bei einer solchen Auswahl ist nicht nur die geografische Verteilung 
und die Anzahl der Kollokatoren, sondern auch eine Analyse der Derivationen, 
z. B. von Komposita, etwa um sich für die weitere Analyse das relevante Wortfeld 
zu erschließen. 

Schließlich zeigt Abbildung 77 ein Beispiel für die Auswahl bestimmter 
Dornseiff-Kategorien. Im Beispiel sind es die Sachgruppen „Angriff“, „Kampf“, 
„Kämpfer/Armee“, „Krieg“, „Streit“ und „Töten“ ausgewählt. Das Untersuchungs- 
interesse lag hier darin, Kriegsdiskurse zu untersuchen. Angezeigt werden damit 
nur Kollokatoren, die diesen Sachgruppen angehören. Damit kommen seman- 
tisch zusammenhängende Kollokatoren in den Blick. Allerdings müsste für eine 
sinnvolle und ergiebigere Analyse die Zuordnung zu den Sachgruppen verbes- 
sert werden, etwa indem die Lexeme im Korpus disambiguiert werden oder eine 
gänzlich andere Methode zur semantischen Annotation benutzt würde. Obwohl 
die Dornseiff-Kategorien sinnvoll für semantische Analysen eingesetzt werden 
können (vgl. dazu Scharloth et al. 2013; Bubenhofer et al. 2015a), hielt sich der 
Nutzen im Fall der Geokollokationen in Grenzen. Das liegt vor allem daran, dass 
einzelne Kollokatoren niemals eindeutig einer bestimmten Sachgruppe zugeord- 
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net werden können, zumal ohne den weiteren Kontext fiir eine Disambiguierung 
zu nutzen. Deshalb wurden die Dornseiff-Kategorien für die weiteren Visualisie- 
rungsexperimente nicht mehr weiter benutzt. 


Abb. 77: Geokollokationen Version 1: Darstellung von Sachgruppen nach Dornseiff 


6.2.4 Erweiterte Version 2.0 


Eine Erweiterung des Teams um die Informatikstudentin Katrin Affolter, die Com- 
puterlinguistikstudentin und Spezialistin für Informationsvisualisierung Danica 
Pajovic und den Linguisten/Computerlinguisten Klaus Rothenhäusler führte zu 
weiteren Diskussionen zur Visualisierung der Geokollokationen. Die drei lenkten 
den Fokus auf die mangelhafte programmiertechnische Implementierung und die 
Entwicklung weiterer Visualisierungsideen. Dabei ist Folgendes interessant: Nur 
ich selbst benutzte das Geokollokationen-Werkzeug, um tatsächlich zumindest in 
Ansätzen diskurslinguistische Studien durchzuführen. Je mehr Leute an der Ent- 
wicklung beteiligt sind, desto stärker ergeben sich personelle Spezialisierungen 
zwischen Anwendung, visueller Konzeption, Design und Programmierung. Damit 
steigt der Koordinationsaufwand an, um eine gemeinsame Verständigung über 
die Ziele und Wege der Arbeit zu erhalten, und es wird besonders wichtig, das 
Praxiswissen im Umgang mit der Anwendung zu teilen. Dies erreichten wir nur zu 
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Teilen, so dass sich die Anwendung zeitweise auch in Richtungen entwickelte, die 
fiir diskurslinguistische Untersuchungsinteressen nicht dienlich waren. 

Die neuen Ideen führten zu teilweise erneuertem Code und einer anderen 
Datenbankanbindung: Statt in einer relational organisierten PostgreSQL-Daten- 
bank” werden die Daten seither in einem Elasticsearch-Index” vorgehalten. 
Hinter Postgres und Elasticsearch stehen nicht bloß zwei verschiedene Daten- 
bankprogramme, sondern zwei unterschiedliche Prinzipien der Datenorganisa- 
tion, nämlich sogenannte SQL vs. NoSQL-Prinzipien.’° Relationale Datenban- 
ken wie PostgreSQL verlangen ein vorher definiertes Datenbankschema, das 
normalerweise dem Prinzip folgt, Daten in verschiedenen Tabellen abzulegen, 
die miteinander verknüpft werden. Im Beispiel der Geokollokationen existieren 
die drei Tabellen „lexemes“, „places“ und „collocations“. In „lexemes“ sind alle 
vorkommenden Lexeme aufgeführt, in „places“ alle Orte (mit den Angaben zur 
Georeferenzierung) und „collocations“ verknüpft die beiden Tabellen insofern 
miteinander, als dass es für jede Kollokation einen Fintrag dort gibt, der besagt, 
welche Lexem-ID mit welcher Place-ID verknüpft ist. Dazu können dann weitere 
Informationen zur Frequenz, Signifikanz etc. angegeben werden. 

Anders das auf dem Datenbanksystem „Lucene“’ basierende Elasticsearch, 
welches dokumentenzentriert arbeitet und für schnelle Volltextsuchen in großen 
Datenmengen optimiert ist. Jedes darin befindliche Dokument kann eine eigene 
Struktur haben und es gibt kein datenbankweites gemeinsames Schema. Das 
System sorgt selbst für eine optimale Indizierung und ggf. Aufteilung der Daten 
und der Prozessierung der Suchabfragen auf verschiedene Server. Im Fall der 
Geokollokationen sind die Kollokationsprofile zu den Toponymen die „Doku- 
mente“. Sie enthalten gleichzeitig auch die Georeferenzen und weitere Angaben 
zu Frequenz und Signifikanz, die in der relationalen Datenbank auf andere Tabel- 
len ausgelagert sind. 

Die Entscheidung, ob eine relationale SQL oder eine NoSQL-Datenbank ver- 
wendet wird, führt also zu unterschiedlichen Ansätzen der Datenmodellierung 
und ermöglicht unterschiedliche diagrammatische Operationen der Datenma- 
nipulation. Oder konkreter: NoSQL-Datenbankstrukturen bedingen ein anderes 
diagrammatisches Denkmodell als SQL-Datenbanken. 


74 Vgl. https: //www.postgresaql.org (letzter Zugriff: 22.9.2020). 

75 Vgl. https: //www.elastic.co/ (letzter Zugriff: 22.9. 2020). 

76 „SQL“ steht für „Structured Query Language“ und meint die für die Erstellung, Verwaltung 
und das Abfragen von relationalen Datenbanken nötige Datenbanksprache. „NoSQL“ bedeutet 
eben „not SQL“ oder „not only SQL“ und steht für nicht-relationale Datenbanksysteme. 

77 Vgl. https://lucene.apache.org/core/ (letzter Zugriff: 22.9. 2020). 


232 —— Sprachgebrauch und Ort 


Die Organisation des Javascript-Codes wurde ebenfalls optimiert, indem er 
modularisiert, also auf verschiedene Dateien aufgeteilt wurde (Affolter 2016a). 
Die grundlegende Technologie veränderte sich ansonsten aber gegenüber der 
Vorversion nicht. In Kombination mit der neuen Datenbankanbindung verän- 
derte sich aber die Aufgabenverteilung zwischen Server und Client. Der Client, 
also das Browserprogramm auf dem Computer der Nutzerin/des Nutzers, der 
den Javascript-Code interpretiert und die Darstellung erzeugt, übernimmt in der 
neuen Version weniger Aufgaben der Datenselektion. In der Version davor lieferte 
der Server den gesamten Datensatz an den Client und die Auswahl bestimmter 
Datensätze (bestimmter Toponyme, Anzeige bestimmter Kollokatoren) geschah 
mittels Javascript-Code beim Client. In der neuen Version geschieht die Selektion 
auf dem Server und dieser liefert nur die tatsächlich für die Darstellung relevan- 
ten Daten. Es gibt selbstverständlich ein technologisches Argument dafür, mehr 
Aufgaben dem Server zu überlassen, nämlich Geschwindigkeit: Der Server ist 
bezüglich Hardware normalerweise besser ausgestattet als die Clients und muss 
immer wieder gleiche Operationen nicht immer neu ausführen, sondern kann die 
Ergebnisse zwischenspeichern und so schneller ausgeben. Doch das Aufteilungs- 
prinzip zwischen Client und Server gestaltet sich eben auch vor dem Hintergrund 
von Coding Cultures mit Auswirkungen auf das Verhältnis zwischen Mensch, 
eigenem Computer und Servern, insbesondere was die Kontrolle über die Daten 
und damit auch die Analysemöglichkeiten betrifft. In unserem Setting ist dieser 
Aspekt selbstverständlich vernachlässigbar, da wir kompletten Zugriff auf den 
Server haben und wir das Interface so gestalteten, dass der komplette Datensatz 
ohne jegliche Selektion immer abgerufen werden kann. Aber bei der Weitergabe 
der Anwendung für Nutzerinnen und Nutzer außerhalb des Entwicklerkreises 
ohne Zugriff auf den Server erhöht man damit die Intransparenz über die Daten- 
struktur und -Manipulation.’® In Abbildung 78 ist beispielhaft die Ausgabe der 
Variable „data“ während der Nutzung der Geokollokationen-Anwendung abgebil- 
det, die nicht nur die Daten selbst, sondern auch deren Strukturierung preis gibt. 
Nur ein Teil dieser Angaben wird in der Visualisierung überhaupt verwendet. Da 
aber diese Informationen für jeden Nutzer/jede Nutzerin einsehbar ist, tragen alle 
clientseitige Operationen immer zu Transparenz der Anwendung bei. 


78 In „normalen“ Nutzungskontexten ist vielleicht gar nicht deutlich, wie transparent clientsei- 
tig ausgeführter Javascript-Code eigentlich ist: Die Browser bieten nämlich normalerweise eine 
Konsolen- oder Entwickler-Ansicht, mit der alle Variablen und Datenstrukturen, die sich gegen- 
wärtig im Arbeitsspeicher befinden, eingesehen werden können. Damit ist weitgehende Trans- 
parenz über die beim Client verfügbaren Daten gegeben, auch wenn diese nicht alle tatsächlich 
vom Browser ausgegeben werden. 
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Y Array 
¥ Object 
E color: "#990000" 
» D country: ("ar") 
C cx: s80. 7486156821303 
C cy: 479.52972105667607 
Dia: ı 
> lat: [-34.61315) 
» [C] loc_type: ("PPLC™) 
» (lon; [-S8.37723) 
E name: “Buenos Aires” 
C radius: 2.0354243542435424 
E shortcut: “buenos_aires“ 
vw L words: Array 
> (lemma: "Stadt", pos: "NN", frequency: 14, rel_frequency: ©, significance: 0.0001, ~} 
> (tesna: “argentinisch", pos: "ADJA", frequency: 14, re\_frequency: @, significance: 0.0001, ~} 
> (lemma: “gebSren™, pos: “WPP", frequency: 11, rel_frequency: ®, significance: 0.0001, -} 
> (lemma: "Erzbischof", pos: "NN", frequency: 11, rel_frequency: ©, significance: 6.0001, —} 
> {lemma: "Botschaft", pos: "NN", frequency: 10, rel_frequency: 8, significance: 0.0001, _} 
> (temna: “Argentinier”, pos: "NN", frequency: 9, rel_frequency: @®, significance: 8.0801, -} 
» Array Prototyp 
» Object Prototyp 


> (name: "Bolivia", lon: [-65), lat: [-17], country: ("bo"), loc_type: ["PCLI"), ~} 

> {name: “Oleoduto PETROBRAS", Lon: [-46.68275], lət: [-23.0159], country: ["br"], loc_type: ["OILP"], -} 
> (name: "Salvador da Bahia", lon: [-38.51083), lat: (-12.97111}, country: ["br"], loc_type: ["PPLA"], =) 
> (name: "Olivença", lon: [-37.19056), L {-9.51861), country: ("br"), loc_type: ("PPL"), =} 

> {name: "La Palma”, lon: [-118.04673], lat: [33.8464], country: ["us"], loc_type: ("PPL"), -} 

> (name: "Mexiko-Stadt", lon: (-99.12766), lat: [19.42847}, country: ("mx"), loc_type: ["PPLC"], ~} 

> {name: "Vietnam", lon: [-111.57579), Lat: [30.33568), country: ("ax"), loc_type: ["RSVI"], -} 

> {name: "Droemer Lake”, Lon: (-97.13693], tət: [30.11688), country: ["us"], loc_type: ("RSV"), =} 

> {name: "Texas", lon: [-99.25061), lat: [31.2544], country: ["us"], loc_type: ["ADMI"], -} 

> (name: "Merkel", ton: [-100.01287), lət: [32.47068], country: ("us"), loc_type: ("PPL"), -} 

> {name: “Fairfield”, lon: [-122.03997], lat: [38.24936], country: ("us"), loc_type: ["PPLA2"], -} 

> {name: “Las Vegas", lon: [-115.13722], lat: (36.17497), country: ("us"), loc type: ["PPLA2"], =} 

> (name: "Nevada", lon: [-116.75119], lət: (39.25021), country: ["us"], loc_type: ("Ami"), —} 

> (name: "United States”, ton: [-98.5], lat: [39.76], country: ("us"), loc_type: ["PCLI™), =} 


Abb. 78: Konsolenansicht im Browser (Apple Safari) bei der Nutzung der Geokollokationen- 
Anwendung; Ausgabe der Struktur und Inhalte der Variable „data“ (Ausschnitt). Diese Ausgabe 
ist in jedem Client erzeugbar 


In unserem Fall sind trotz der Verlagerung einiger Datenmanipulationen auf 

den Server die Operationen noch relativ transparent, da die Menge der zurück- 

zugebenden Daten direkt über das Bedienfeld der Geokollokationen-Anwen- 
dung beeinflusst werden kann und sich je nach den Einstellungen dort zwar der 

Umfang der zurückgegebenen Daten verändert, nicht jedoch deren grundlegende 

Struktur. 

Im Bereich der Visualisierung kam es mit der Version 2 zu folgenden Erwei- 
terungen: 

— Neuer Modus zur Darstellung der Kollokatoren: Neben der Darstellung als 
Liste gibt es nun die Möglichkeit, dass die Anzahl der Kollokatoren mittels 
entsprechend skalierter Punkte dargestellt wird (vgl. Abbildung 79, S. 234). 

— Bei Berührung eines Ortspunktes erscheint eine scrollbare Liste mit allen 
zugeordneten Kollokatoren (sogenannter „Tooltip“), absteigend geordnet 
nach Signifikanz und Frequenz, wobei die Wortartenzugehörigkeit farblich 
codiert ist (vgl. Abbildung 80). Wenn die Kollokatoren nicht direkt auf der 
Karte dargestellt werden können (weil es zu unübersichtlich würde), scheint 
die separat aufrufbare geordnete Liste die beste Möglichkeit, sich schnell 
einen Überblick verschaffen zu können. 
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Abb. 79: Version 2 der Geokollokationen-Anwendung; Übersicht 


- Über einen Rechtsklick auf einen Ortspunkt können weitere Befehle aufgeru- 
fen werden; dazu siehe die weiteren Ausführungen unten. 

- Um globale und lokale Kollokatoren und generell deren Verbreitung visu- 
alisieren zu können, gibt es eine neue Darstellung, die vom sogenannten 
„Sankey-Diagramm“ inspiriert ist (Sankey 1896). Über das Menü mit den wei- 
teren Befehlen kann ein Kollokator ausgewählt werden, dessen Verbreitung 
angezeigt werden soll. Der Kollokator wird dann am unteren Bildschirmrand 
aufgeführt und Linien verbinden diesen mit allen Ortspunkten, an denen er 
vorkommt (vgl. die Linien von „Flüchtling“ zu den Ortspunkten in Abbildung 
79). Die entsprechenden Ortspunkte werden grün hervorgehoben. Die Strich- 
dicke korreliert mit der Frequenz des Kollokators. Diese Darstellung erwies 
sich jedoch im sogenannten „Dorling“-Modus als nützlicher, auf den ich 
gleich zu sprechen komme. 

- Die Datengrundlage kann über das Bedienfeld beeinflusst werden; so können 
wie auch schon bei der Vorversion mit Regulären Ausdrücken zur Kollokato- 
ren mit bestimmten Zeichenfolgen dargestellt werden. 
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Abb. 80: Geokollokationen Version 2: Tooltip-Menü für die Anzeige der Kollokatoren 


6.2.5 Loslösung von der geographischen Darstellung 


Ein kritischer Punkt der Kartendarstellung ist ihre Bindung an die Topographie. 
Geht man von der Forschungsfrage nach diskursiv geprägten Konstruktionen 
von Welt aus, interessiert ja unter Umständen gerade die Differenz dieser zur 
geographisch-topographischen Weltsicht und die daraus ableitbaren Beobach- 
tungen. Diese geographisch-topographische Weltsicht wird durch die Kartendar- 
stellung zwar auch nur verzerrt dargestellt, da die Visualisierung der Welt auf 
einer zweidimensionalen Fläche nur über eine Projektion der kugelartigen Form 
auf die Fläche erreicht werden kann (vgl. zum Problem der Projektionen bei der 
Kartendarstellung und zur kritischen Kartographie Smith 1992; Glasze 2009). 
Doch davon abgesehen, müssten diskursiv geprägte Weltsichten nochmals weiter 
entfernt von der geographischen Topographie gestaltet sein. 

Es gibt in der Kartographie verschiedene Ansätze, die Kartendarstellung 
mittels weiterer Variablen wie Bevölkerungsdichte, Wirtschaftskraft o.ä. zu ver- 
zerren.’? Eine Möglichkeit ist die sogenannte ,,Dorling“-Karte (Dorling 1993), bei 
der geographische Einheiten wie Staat, Provinz, Gemeinde o.ä. in ihren Formen 
bezüglich einer beliebigen Variable verzerrt dargestellt werden. Ein einfacher 
Algorithmus ist dabei die Überführung der Umrisse der geographischen Einhei- 
ten in Kreise. Die Größe der Kreise ist abhängig vom Wert der Variable und die 


79 Vgl. etwa das „Wordmapper“-Projekt: http://www.worldmapper.org/ (22.9.2020). 
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Kreise werden, ausgehend von ihrer ursprünglichen geographischen Position, so 
angeordnet, dass sie sich nicht überlappen. 

Für die Geokollokationen-Anwendung ist der Gedanke naheliegend, die Orts- 
punkte als Kreise in Abhängigkeit der Summe der Frequenzen der signifikanten 
Kollokatoren dazu darzustellen.®° Dabei realisieren wir einen fließenden Übergang 
zwischen der konventionellen Kartendarstellung und dem Dorling-Diagramm: Die 
Umrisse der jeweiligen Ortspunkte werden zu den verschieden großen Kreisen 
transformiert und werden, ausgehend von der ursprünglichen Lage auf der Karte, 
relokalisiert, so dass sie sich gegenseitig nicht überlappen. Diese grafische Trans- 
formation ist wichtig, um die konzeptionelle Transformation der diagrammati- 
schen Darstellung nachvollziehen und deren Ergebnis verstehen zu können (vgl. 
für eine Diskussion zu Animationen in Visualisierungen Fisher 2010). 

Eine Schwierigkeit liegt jedoch in der Problematik, dass die Ortspunkte belie- 
bige geografische Einheiten sein können: Städte, Gemeinden, Provinzen, Staaten, 
Kontinente. Es ergeben sich also sehr viele Kreise in der Dorling-Darstellung. Tech- 
nisch ist das ohne Weiteres darstellbar, aber der Bezug zur ursprünglichen Karte 
ist noch schwächer, da beispielsweise die Städte eines Staates eigene Kreise außer- 
halb eines weiteren Kreises für den ganzen Staat sind. Es ist aber möglich, die 
Darstellung bereits bei der konventionellen Karte auf Ebene Staaten zu aggregie- 
ren, also die Kollokatoren der verschiedenen Ortspunkte innerhalb eines Staates 
zusammenzuführen. Dann ist der Bezug zur ursprünglichen Karte viel deutlicher. 

Die Abbildungen 81 und 82 zeigen Dorling-Karten, die einen „Flucht-Diskurs“ 
in zwei verschiedenen Zeitabschnitten (1961-1980 und 2000-2016) repräsentie- 
ren sollen. Es werden Kollokatoren angezeigt, die auf den Regulären Ausdruck 
.*C[Ff]1l[Luülcht|[MmJigra).x passen, also alle Derivationen der Lexeme 
„Flucht“ und „Migration“ / „Migrant“. 

Die Karten zeigen jeweils eine deutliche Fokussierung der (in diesen spe- 
zifischen Daten repräsentierten) Diskurse auf Deutschland, der jedoch bei den 
neueren Daten von 2000-2016 noch viel stärker ist als in der Zeit von 1961-1980. 
Weiter zeigen sich klare Verschiebungen der weiteren in den Diskurs involvier- 
ten Regionen: (Eher) südliches Afrika und Asien in den älteren, Nordafrika und 
Naher Osten in den neueren Daten. Zwar sind auch in den älteren Daten einige 
europäische Länder in diesen Kontexten genannt, das ist bei den neueren Daten 
jedoch viel stärker ausgeprägt, vor allem jene Länder, durch die Migrationswan- 
derungen laufen. 


80 Und die Größe der Kreise sollte in Abhängigkeit der jeweils ausgewählten Datenmenge ste- 
hen, d.h., wenn über die Filtermöglichkeiten, etwa auch die Beschränkung auf bestimmte Kollo- 
katoren, die Datenmenge eingeschränkt wird, passt sich auch die Größe der Kreise an. 
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Flucht Puctmirg Flüchtingskonwertion Bosen Fluchiieg Fluchtingsprotien 


Abb. 81: Geokollokationen Dorling-Darstellung; Flucht-Diskurs 1961-1980 


Abb. 82: Geokollokationen Dorling-Darstellung; Flucht-Diskurs 2000-2016 
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Neben den möglichen feineren Deutungen, die ich hier nicht anstellen möchte, 
zeigt der Effekt der Dorling-Darstellung jedoch ziemlich klar den deutlichen 
innenpolitischen Fokus der aktuellen Migrationspolitik. Thema ist viel weniger 
die Frage nach den Regionen, in denen Flucht tatsächlich entsteht bzw. stattfin- 
det, sondern Europa - und zumindest aus der Perspektive der deutschen Presse — 
insbesondere Deutschland selbst .®' 


6.3 Fazit 


Ich möchte nun die bisherige Diskussion der Geokollokationen aus diagramma- 
tischer Perspektive prägnant zusammenfassen, um die Studie vor dem Hinter- 
grund der erarbeiteten theoretischen Überlegungen situieren zu können. Danach 
soll ein Ausblick gegeben werden, wie das Visualisierungsprinzip weiter entfaltet 
werden kann. 


6.3.1 Diagrammatische Verortung 


Durch die topografische Deutung der Toponyme, der Georeferenzierung und der 
damit möglich gewordenen Kartendarstellung (diagrammatische Grundfigur: 
Karte) kam es zu einer Dimensionsanreicherung der Daten. Die geografische 
Dimension ermöglicht dadurch bei der Interpretation eine neue Sicht auf die 
Daten, da ihre räumliche Konstellation darstellbar wird. Gleichzeitig ist es so, 
dass zu den Toponymen Kollokationsprofile berechnet worden sind, um deren 
diskurslinguistisches Profil zu modellieren. Die Berechnung der Kollokations- 
profile ist möglich, weil ein Vektorraum angenommen wird, in dem die Topo- 
nyme aufgrund ihres Kollokationsverhaltens positioniert werden können. Diese 
Annahme nutzt also die diagrammatische Grundfigur des Vektors aus. Mit dieser 
diagrammatischen Transformation gehen sowohl eine Rekontextualisierung als 
auch eine Desequenzialisierung der Daten einher: Die Einheit der Texte wird auf- 
gebrochen, indem in einem ersten Schritt für die Kollokationsberechnung Indizes 
(diagrammatische Grundfigur: Liste) erstellt werden müssen, wobei diese selber, 
als auch die daraus entstehenden Kollokationsprofile die aus den Texten hinaus- 
gerissenen Einzellexeme neu kontextualisiert werden. 


81 Es wäre zu prüfen, ob dieser Fokus auf die Innenpolitik bei Flüchtlingsdiskursen auch bei 
anderen Ländern der Fall ist und ob dies alle Aspekte des Diskurses betrifft. 
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Mit der Kartendarstellung bewegt man sich in einer stark kanonisierten Visua- 
lisierungspraxis, die von bestimmten Denkstilen geprägt ist. Mit der kritischen 
Kartographie gibt es jedoch Ansätze, die die Praktiken in Frage stellen und bei- 
spielsweise das Problem der verzerrenden Projektionen eines dreidimensionalen 
Raums auf die Fläche problematisieren. Hier kommt es nun zu einer fruchtba- 
ren Wechselwirkung zwischen programmiertechnischen Coding Cultures und 
Überlegungen der kritischen Kartographie: Um alternative Visualisierungsprin- 
zipien für geografische Daten zu finden, sind Experimente wichtig. Während bis 
vor wenigen Jahren hochspezialisierte Software verwendet werden musste, um 
digitale Karten zu erstellen, entwickelte sich eine Coding Culture, die geprägt 
ist durch Open Source, White Box, Entprofessionalisierung und Selbstermäch- 
tigung. Mit dieser gibt es nun die technischen Möglichkeiten wie Javascript und 
D3, wie wir sie für unsere Arbeiten ebenfalls verwendet haben. Mit diesen Tech- 
nologien kann ohne großen Aufwand und auf Basis von Beispielen Code an die 
eigenen Daten angepasst werden. Die Bibliotheken zur Darstellung von Karten 
sehen beispielsweise standardmäßig vor, dass zwischen unterschiedlichen Pro- 
jektionen gewechselt werden kann. Wichtig in unserem Fall waren bestehende 
Bibliotheken und Programmierbeispiele jedoch für die Entwicklung der Dorling- 
Darstellung der Karten, die ja Netzgraph, Flussdiagramm und Karte miteinander 
verbindet. Damit werden die bereits verwendeten diagrammatischen Grundfigu- 
ren der Liste und der Karte um die Grundfigur Graph ergänzt, womit sich der Mög- 
lichkeitsraum des diagrammatischen Operierens stark erweitert und ein reiches 
Visualisierungsprinzip entsteht (vgl. Abschnitt 5.7). 


6.3.2 Ausblick 


Die Ausführungen zu den Geokollokationen zeigen den langen Weg der Genese 
dieser Visualisierungsanwendung. Hinzu tritt der Befund, dass - sobald man 
damit arbeitet — weitere Ideen für Berechnungs- und Visualisierungsmöglich- 
keiten entstehen. Ist erst ein Prinzip der Darstellung, also ein bestimmtes Trans- 
formationsverfahren in Verbindung mit einer diagrammatischen Grundfigur, 
gefunden (hier die Darstellung der Geokollokationen auf verschiedenen Karten), 
lassen sich darin mannigfaltige Darstellungsvarianten ableiten, so dass sich ein 
reiches Visualisierungsprinzip mit einem weiten Möglichkeitsraum ergibt. Das 
scheint mir, wie oben erwähnt, bei den Geokollokationen der Fall zu sein und ich 
möchte diese weiteren Möglichkeiten nun folgend skizzieren. 

Vorab ist aber Folgendes wichtig: Reiche Visualisierungsprinzipien lassen 
sich schlecht in ein abgeschlossenes Tool zwingen. Bei Präsentationen der Geo- 
kollokationenanwendung tauchten immer wieder Fragen nach der Software auf: 
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Ob das Tool heruntergeladen und für eigene Daten verwendet werden kann. Zwar 
veröffentlichten wir den kompletten Code der Geokollokationenanwendung®, 
verfolgten jedoch nicht das Ziel, eine sogenannt „Out of the Box“ benutzbare 
Software zur Verfügung zu stellen. Und dies aus dem Grund, da wir die Erstellung 
der Visualisierungsprinzipien — und damit auch die Programmierung - und die 
Analyse der Daten als nicht zu trennendes Arbeitspaket ansehen. Die Ausführun- 
gen zur Genese der Geokollokationen-Anwendungen sollten gezeigt haben, wie 
technische Moden und wissenskulturelle Prägungen bestimmte programmier- 
technische Umsetzungen nahelegen und man sich damit in bestimmte Coding 
Cultures einfügt und sich ihnen und ihren Topoi unterwirft. Damit schlägt man 
nicht nur bestimmte Wege der technischen Umsetzung, sondern eben auch der 
diagrammatischen Lösungen und des Designs ein. Das komplette Paket von digi- 
taler Datentransformationen, algorithmisch erstellten Diagrammen und dafür 
genutzten Codes ist zwar mächtig in dem Sinne, dass komplexe interaktive Visu- 
alisierungen erstellt werden können, die auf großen Datenmengen basieren. 
Gleichzeitig ist man aber in deutlich vorgegebenen Bahnen der diagrammati- 
schen Praxis gefangen. Dieser Bahnen der Praxis sollte man sich bei der Erstel- 
lung von Visualisierungen auf allen Ebenen und zu allen Zeitpunkten bewusst 
sein, was nur dann geht, wenn das Tool eine ‚offene Box‘ ist und man die techni- 
sche Expertise und damit den Zugriff auf alle Ebenen und Komponenten besitzt. 

Innerhalb des Visualisierungsprinzips, auf dem die Geokollokationenanwen- 
dung beruht, besteht nun ein weiter Möglichkeitsraum: Insbesondere die Trans- 
formation der klassischen topografischen zur abstrakteren Dorling-Karte ist dafür 
verantwortlich. Auf Basis dieser Transformationen ergibt sich eine Erweiterung 
des Möglichkeitsraums um eine abstraktere, von der geografischen Ordnung ent- 
fernten Ebene. 

Bei der Illustrierung dieser Dorlingdarstellung (vgl. Abschnitt 6.2.5) zeigte 
ich nur Karten, deren Bezug zur geografischen Karte noch deutlich sichtbar ist. 
Die Dorlingkarte erlaubt darüber hinaus aber auch alternative Gruppierungen 
der Länder, etwa aufgrund der Ähnlichkeit ihrer Kollokationsprofile: Länder, die 
ähnliche Kollokatoren aufweisen, gruppieren sich zu Clustern, so dass die Dif- 
ferenz zwischen diskursiv aufgeladener Semantik eines Landes mit dessen geo- 
grafischen Lage deutlich hervortritt. Eine andere Möglichkeit besteht darin, die 
Länder gemäß Ähnlichkeit spezifischer Attribute zu clustern. 

Ein Beispiel für eine Clusterung von Ländern bezüglich der Ähnlichkeit 
ihrer Kollokationsprofile ist die Thematisierung der Himmelsrichtungen „West“, 
„Ost“, „Nord“ und „Süd“ in Verbindung mit Regionen. Bei den Spiegel/Zeit-Daten 


82 Vgl. https://gitlab.uzh.ch/rothenha/geocollocationsscripts (letzter Zugriff: 22.9. 2020). 
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von 2010 bis 2016 zeigt sich beispielsweise folgende Gruppierung bezüglich der 

Nennung von Himmelsrichtungen als Kollokator (Mindestfrequenz: 20): 

- Osten: China, Indien, Afghanistan, Syrien, Israel, Russland, Ukraine, Libyen, 
Polen, Deutschland, Frankreich, USA 

— Westen: China, Indien, Afghanistan, Iran, Syrien, Saudi-Arabien, Israel, 


Russland, Libyen, Deutschland, Ukraine, Polen 


- Norden: Deutschland, Frankreich, Italien, Mali, Griechenland, Syrien, Afgha- 


nistan 


- Süden: Deutschland, Frankreich, Italien, Spanien 


Nach Ländern bezüglich ihrer Attribute gegliedert ergibt sich Tabelle 12. 


Tab. 12: Ähnlichkeit von Ländern bezüglich Attribuierung mit Himmelsrichtungen 


Osten Westen Norden Süden 
Deutschland | a a a 
Afghanistan | | | 
Syrien | | x 
China a a 
Indien a a 
Israel a a 
Libyen a E 
Polen a a 
Russland a a 
Ukraine a a 
Frankreich a a a 
USA a 
Iran u 
Saudi-Arabien u 
Italien a E 
Griechenland m 
Mali a 
Spanien | 
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Es gibt aus deutscher, medial repräsentierter Perspektive zwischen 2010 und 
2016 eine Gruppe von Landern, die bipolar mit Westen und Osten, sowie ein 
Land, Italien, das bipolar mit Norden und Siiden attribuiert wird, bei anderen 
hingegen ist nur eine unipolare oder dann tri- oder tetrapolare Attribuierung zu 
beobachten. Dahinter stecken unterschiedliche semantische Lesarten der Him- 
melsrichtungen, nämlich einerseits eine semantisch nicht weiter konnotierte 
Regionenbezeichnung („die Stadt befindet sich im Norden von Frankreich“), 
andererseits eine ideologisch oder anderweitig aufgeladene bipolare Beziehung 
(„der wirtschaftlich erfolgreiche Norden hat genug vom armen Süden“ oder „die 
Ukraine ist Puffer im Spannungsverhältnis von Ost und West“). Dabei müssen im 
letzteren Fall natürlich nicht beide Himmelsrichtungen im selben Text oder gar 
Satz genannt werden, wie das folgende Beispiel zeigt: 


Über Ethik will Yang nicht sprechen: „In der Firma redet man nur über Geschäfte.“ Mögen 
sich die Politiker in Peking, Washington und Brüssel mit Handelsregeln für das Textilge- 
schäft abmühen - China ist für ihn nicht mehr das Land der Seide, sondern eine Art wilder 
Osten des 21. Jahrhunderts, ein Land unbegrenzter Möglichkeiten. „Design und Qualität 
unserer Produkte sind bereits Weltklasse“, beschreibt Yang die Lage von Lenovo. (Georg 
Blume: „Wird die Welt chinesisch?“, Die Zeit, 16. 6.2005) 


Wenn jedoch eine geografische Entität in Texten sowohl in den Zusammenhang 
von Ost und West bzw. Nord und Süd gebracht wird, scheint insgesamt die ideo- 
logisch oder anderweitig aufgeladene Semantik im Spiel zu sein. In den Daten 
finden sich aber auch Beispiele, in denen West und Ost sogar im gleichen Satz 
genannt wird: 


Und deshalb zieht keine andere Stadt in Indien die Zerstörungswut der Islamisten so auf 
sich wie die Gloriole am Arabischen Meer. Mumbai ist der Westen im Osten, Börse und 
Bollywood, das Finanzzentrum des Milliardenvolks und dessen Traumfabrik, für Indien ist 
es New York und Los Angeles in einem. Westlicher Sindenpfuhl für die einen, die von Geld, 
Globalisierung und der Moderne nach Art des Westens nichts wissen wollen, Schmelztiegel 
für die anderen, die dabei sein wollen. (Rüdiger Falksohn et al.: „Im Dreieck des Todes“, 
Der Spiegel, 49/2008) 


Es ergibt sich nun also eine Gruppe von Ländern, nämlich China, Indien, Israel, 
Libyen, Polen, Russland und die Ukraine, bei der eine solche Lesart in „Spiegel“ 
und „Zeit“ vorherrschend ist. 

Aufgrund solcher Daten, die jedoch noch sorgfältiger und weitergehender 
aufbereitet werden müssten, indem z.B. alle Derivationen von Nord, Süd, West 
und Ost berücksichtigt würden, kann eine diskursiv geprägte Weltsicht kartogra- 
fiert werden. Die Dorling-Darstellung bietet die nötige Flexibilität, um dies dia- 
grammatisch umzusetzen. 
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Bei einer von der geografischen Karte stark abstrahierten Darstellung stellt sich 
jedoch die Frage nach ihrem Mehrwert gegenüber anderen Darstellungen, wie 
etwa einer Tabelle (wie Tabelle 12). Der muss in der Transformation zwischen 
konventioneller Karte und Dorling-Karte liegen, mit der die Reorganisation 
visuell wahrgenommen werden kann. Gleichzeitig könnte die Distanz zwischen 
geografischer und neuer Position grafisch angezeigt werden, was wiederum ein 
neu zu deutendes Kriterium für eine Klassifizierung zweiter Ordnung wäre. 

Je nach Forschungsinteresse und interpretatorischer Methode sind weitere 
Ausbauten der Geokollokationenanwendung denkbar. Die Standardforderung 
der Visual Analytics, nach Ben Shneidermans „Visual Information Seeking 
Mantra“ - „Overview first, zoom and filter, then details-on-demand“ (Shneider- 
man 1996) — würde eine engere Verknüpfung der dargestellten Geokollokatio- 
nen mit den Originaltexten vorsehen. Damit gesellt sich zur diagrammatischen 
Grundfigur der Karte noch jene der Liste als Index für die Volltexte, was den Mög- 
lichkeitsraum des Visualisierungsprinzips nochmals stark erweitert. 

Die Ausführungen zu den Geokollokationen möchte ich an dieser Stelle 
beenden. Ich hoffe gezeigt zu haben, wie stark durchdrungen von technologi- 
schen, methodologischen und wissenschaftskulturellen Fragen und Bedingun- 
gen die Entwicklung einer Visualisierung ist und dass es sich lohnt, diese Aspekte 
immer wieder zu reflektieren. 
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Im Zusammenhang mit der Diskussion zu den diagrammatischen Grundfigu- 
ren und den Effekten der durch sie angestoßenen Transformationen habe ich in 
Abschnitt 5.6.2 auf den Effekt der Desequenzialisierung aufmerksam gemacht, 
den Diagramme oft bewirken. Manchmal ist dieser Effekt erwiinscht, manchmal 
ist Sequenzialität jedoch ein essentieller Aspekt einer Forschungsfrage. Dies ist 
bei der folgenden Studie der Fall, in der ich mich fiir narrative Muster in Alltags- 
erzählungen interessierte. 

In den 1980er-Jahren ist in der Linguistik im deutschsprachigen Raum das 
aufkommende Interesse für Alltagserzählungen festzustellen (Gülich 1980; 
Quasthoff 1980; Ehlich 1980). Dieser gesprächslinguistische Blick auf Sprache 
stieß dabei auf die eher literaturwissenschaftlich geprägte Tradition der Narrati- 
onsforschung und fokussierte sich in Abgrenzung davon auf Erzählungen in All- 
tagssituationen, wie beispielsweise Erzählen bei Kindern (Boueke 1995), in der 
Schule (Rehbein 1984; Ehlich 2007a) oder bei schriftlichem Erzählen in der Zweit- 
sprache (Knapp 1997). Vorläufer dieser Studien sind die Arbeiten von Labov und 
Waletzky (1973), die eine linguistische Erzähltheorie entwickelten und u.a. fünf 
Erzählfunktionen vorschlugen, mit denen Alltagserzählungen gegliedert werden 
können. Die fünf Funktionen sind: Orientierung, Komplikation, Evaluation, 
Resolution und Coda (Labov/Waletzky 1973, 112, 116, 122). Diese Erzähltheorie 
wurde rege aufgenommen und unter anderem in den oben erwähnten Arbeiten 
weiterentwickelt (vgl. Bubenhofer 2018b, 365). 

Mein Interesse galt in der nun folgend dargestellten Studie vor allem metho- 
dologischen Fragen zu korpuslinguistischen Ansätzen für die Analyse narrativer 
Muster vor einem diskurslinguistischen Hintergrund. Eine Vorläuferarbeit ent- 
stand in Zusammenarbeit mit Nicole Müller und Joachim Scharloth, in der dafür 
nötige Methoden entwickelt worden sind — am Beispiel von in Webforen publi- 
zierten Erzählungen Jugendlicher über ihren ersten sexuellen Kontakt (Buben- 
hofer et al. 2013).% Die Grundidee hinter der Methodik lag in der Überzeugung, 
dass sich Alltagserzählungen an bestimmten kulturellen Folien der Erzählens 
orientieren und deswegen, vor allem wenn sie seriell auftreten, von sprachlichen 
Mustern durchdrungen sind, die an der sprachlichen Oberfläche festgemacht 


83 Obwohl die Publikation das Publikationsdatum 2013 trägt, ist die Studie faktisch 2014/15 
zusammen mit Nicole Müller und Joachim Scharloth entstanden; aus publikationsorganisato- 
rischen Gründen ließen die Reihenherausgeber das Heft mit dem Datum 2013 erscheinen. Die 
Ideen zur Studie und die korpuslinguistische Berechnung gehen maßgeblich auf meinen Kolle- 
gen Joachim Scharloth zurück. 


8 Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https://doi.org/10.1515/9783110698732-007 
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werden können. Die leitende Frage war also, welche sprachlichen Muster typisch 
für bestimmte Typen von Alltagserzählungen sind. Darüber hinaus war aber 
inbesondere von Interesse, in welchen Abfolgen oder an welchen Positionen in 
den Geschichten diese Muster typischerweise vorkommen. 

Unsere erste Studie zu diesem Thema erfolgte weniger mit einem diagramma- 
tischen Fokus, sondern einem korpuslinguistischen Forschungsinteresse. Im Fol- 
genden möchte ich nun auf weitere Studien eingehen, die den gleichen leitenden 
Fragen folgen, aber mit einem deutlich diagrammatischen Interesse entstanden 
sind. Im Zentrum stehen dabei Erzählungen von Müttern über die Geburt ihrer 
Kinder, sogenannte „Geburtsberichte“, wie sie in großer Zahl in spezialisierten 
Foren im Web aufgeschrieben werden. Die Analyseergebnisse sind in knapper 
Form bereits andernorts publiziert (Bubenhofer 2018b), der Fokus liegt im Fol- 
genden auch weniger auf den Ergebnissen, sondern auf der diagrammatischen 
Reflexion des Vorgehens. 


7.1 Konzeption der Studie zu den Geburtsberichten 
7.1.1 Fragestellung 


Das wohl immer einmalige und prägende Erlebnis der Geburt eines Kindes 
führte wahrscheinlich schon immer zu verschiedenen Formen des Erzählens und 
Berichtens. Interessant dabei ist, dass der Gegenstand dieser Erzählungen selbst, 
die Geburt, zu den Konstanten menschlichen Lebens gehört und im Grunde 
— zumindest im Fall der Vaginalgeburt — immer gleich abläuft: Das Kind wird 
durch Wehen ausgetrieben. Natürlich kann es dabei zu allerlei Komplikationen 
kommen, aber stärker variiert das Setting um die Geburt herum. Historisch ist 
beispielsweise zu beobachten, dass gegen Ende des 18. und im Verlauf des 19. 
Jahrhunderts in der westlichen Welt die Geburt immer stärker pathologisiert 
worden ist und sich eine medizinische Geburtshilfe entwickelte (Colloseus 2016). 

Das Erzählen über die Geburt ist selbstverständlich auch von einem Wandel 
betroffen. Wenn man sich aber zeitgenössische Erzählungen von Müttern über die 
Geburten ihrer Kinder in einschlägigen Webdiskussionsforen durchliest, ist dabei 


84 Ein „Geburtsbericht“ ist im medizinischen Kontext eine stark formalisierte Textsorte, die die 
medizinischen Aspekte einer Geburt festhält. Offensichtlich ist mit den Erzählungen, mit denen 
wir es hier zu tun haben, nicht das gemeint, sondern persönliche Erzählungen der Mütter selbst, 
die sich vornehmlich an werdende oder andere Mütter richten. In allen untersuchten Foren wer- 
den diese Texte auch „Geburtsberichte“ genannt. 
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eine eigenartige Dichotomie erkennbar: Einerseits wird in einer solchen Erzäh- 
lung normalerweise die Einmaligkeit des Erlebnisses betont und oft auch sehr 
eindrücklich geschildert. Auf der anderen Seite sind die Erzählungen von Sprach- 
gebrauchsmustern durchsetzt, die sich über fast alle Erzählungen verstreut immer 
wieder finden. Offensichtlich gibt es also eine Art narrative Folie, nach der heute 
im Web von Müttern über Geburten berichtet wird. Dieser Folie gilt unser Interesse. 

Ein typisches Motiv in den Geburtsberichten zeigt sich beispielsweise im fol- 
genden Ausschnitt: 


Aber danach ging alles ganz schnell: Muttermund vollständig eröffnet, ich durfte endlich 
pressen.. [sic] 


Und um 0.07 Uhr am 23.5.17 war unsere wunderschöne und liebe Prinzessin nach 9 Press- 
wehen geboren. Sie hat so tapfer alles durchgehalten, ich bin unglaublich stolz - auf uns 
beide! (https://www.urbia.de/archiv/forum/th-4919394/das-ziel-einer-langen-reise-3.html 
letzter Zugriff: 22.9. 2020) 


Im ersten Satz fällt die Formulierung „aber danach ging alles ganz schnell“ auf, 
die in ähnlicher Form auch in anderen Geschichten vorkommt. Im zweiten Absatz 
ist die genaue Zeit- und Datumsangabe auffällig, die zeigt, dass eine Erzählung 
der Geburt zwar Erlebnisberichtcharakter haben soll, mit dem man das Erlebte 
als Leserin oder Leser möglichst nah nacherleben kann, die Erzählung aber 
natürlich eine retrospektivierende Wirkung und Funktion hat: Während der tat- 
sächlichen Geburt war die genaue Uhrzeit wahrscheinlich völlig unwichtig. In der 
retrospektiven Erzählung wird sieim Ablauf der Geschichte genau dann genannt, 
wann dieser Zeitpunkt eben in der erzählten Zeit eingetroffen ist. 

In ihrem seriellen Auftreten in den Geschichten fallen solche Sprachge- 
brauchsmuster auf. Solche wiederkehrenden Formulierungsmuster können nun 
maschinell berechnet werden, so dass die Essenz eines prototypischen Geburts- 
berichts als Aneinanderreihung von solchen Formulierungsmustern repräsen- 
tiert werden kann: 


An diesem Tag hatte ich... > ..., dass es endlich losgeht > ich hatte das 
Gefühl, dass... > Mein Mann und ich waren... > war mir sicher, dass... > auf 
den Weg in die... > Ich sagte ihr, dass... > so heftig, dass ich... > fühlte sich 
an, als > warich fix und fertig > Ich hatte das Gefühl, > dass es nicht mehr 
lange... > ich dachte, ich muss... > , aber es ging nicht > , was das Zeug 
hielt > dann ging alles ganz schnell > Ich weiß nur noch... > um [Uhrzeit] 
war es > das Licht der Welt erblickte > ich konnte es nicht glauben > ich 
war so froh... > , dass es vorbei war > ich hätte nie gedacht, > und ich muss 
sagen, > Für mich war es eine... > noch vor sich haben... 
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Diese Kette ist freilich nur eine mögliche Geschichte - tatsächlich gibt es viele 
verschiedene mögliche Ketten von typischen Formulierungsmustern. Im Fol- 
genden beschreibe ich nun genauer das technische Vorgehen und im Anschluss 
daran die Experimente, die zur Visualisierung der Daten gemacht wurden. 


7.1.2 Datengrundlage 


Es existieren eine Reihe von Webdiskussionsforen, die auf Themen der Eltern- 
schaft spezialisiert sind. Diese enthalten meistens verschiedene Unterforen zu 
spezialisierten Themen, darunter Geburtsvorbereitung und Geburt. Die Foren 
richten sich dabei insbesondere auch an werdende Eltern und speziell werdende 
Mütter und es ist möglich, sich in sogenannten „Monatsforen“ zu betätigen, die 
nach Entbindungstermin bzw. Geburtsdatum gegliedert sind, so dass sich dort 
Mütter treffen, die in der gleichen Schwangerschaftsphase sind bzw. — nach der 
Geburt — deren Babys gleich alt sind. Normalerweise existiert auch eine geson- 
derte Rubrik „Geburtsberichte“. Abbildung 83 zeigt die Startseite eines solchen 
Forums, des „swissmom“-Forums. 
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Abb. 83: Beispiel für ein Elternschaftsforum, hier „swissmom“ (angezeigte Werbung hier nicht 
abgebildet) 
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Für die Analyse der Geburtsberichte wurden sechs Foren aus dem deutschspra- 
chigen Raum ausgewählt: Vier Foren aus Deutschland und je eines aus Österreich 
und der Schweiz. Es handelt sich bei allen um professionelle Foren in dem Sinne, 
dass kommerzielle Organisationen dahinter stehen. Bei urbia.de und eltern.de 
ist es die Gesellschaft G+J Parenting Media GmbH, eine Dachorganisation der 
Gruner und Jahr Verlagsgruppe, mit der digitale Angebote im Elternsegment 
angeboten werden. Parents.at ist ebenfalls eine GmbH, umstandsforum.de und 
babyforum.de gehören der forumhome GmbH und das swissmomforum.ch wird 
von der swissmom GmbH betrieben. Alle Foren werben damit, dass sie Fachper- 
sonen eingebunden hätten. 

Im August 2016 wurden alle damals verfügbaren Postings in den jeweiligen 
Unterforen „Geburtsberichte“ automatisiert heruntergeladen und korpuslingu- 
istisch aufbereitet. Das ergibt eine Menge von gut 14.400 Berichten, die insge- 
samt 12,5 Mio. laufende Wortformen umfassen (vgl. Tabelle 13 für die genauen 
Angaben). 


Tab. 13: Korpus Geburtsberichte („Wörter“ = laufende Wortformen) 


Land Forum # Wörter # Wörter ohne # Texte 


Kommentare 

D http: //www.urbia.de 7.364.108 7.255.550 8.808 
D http://www.babyforum.de 2.089.936 2.057.168 1.824 
A http://www. parents.at 1.199.174 1.183.046 1.647 
CH https://www.swissmomforum.ch 1.156.193 1.138.660 919 
D http: //www.eltern.de 438.017 431.416 716 
D http: //www.umstandsforum.de 289.807 285.453 568 

Total 12.537.235 12.351.293 14.482 


Die Bezeichnung ,,Text“ wurde dabei jeweils fiir einen Thread verwendet, der 
normalerweise aus einem Initialposting, dem eigentlichen Geburtsbericht, sowie 
allfalligen Antworten bzw. Kommentaren dazu besteht. Diese Antworttexte 
waren fiir die weitere Analyse nicht von Belang und wurden deshalb entfernt, 
wobei damit die Anzahl laufender Wortformen auf 12,3 Mio. — also nur minimal — 
schrumpfte. In seltenen Fallen verteilt sich die eigentliche Geschichte auf zwei 
Postings im Thread, etwa wenn sie zu lang war und es technische Beschrankun- 
gen gab, was die Textlange pro Posting betrifft. Diese Falle wurden nicht aus- 
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gesondert und sind deshalb in den Daten nur mit dem Initialposting, also dem 
Anfang der Geschichte, vertreten.® 
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Abb. 84: Korpus Geburtsberichte: Verteilung der Texte tiber Foren und Jahre 


Abbildung 84 zeigt die Streuung der Berichte über Jahre und Foren. Wie ersicht- 
lich ist, stammen die meisten Texte vom Forum ,,urbia.de“ und aus den Jahren ab 
2006. Dabei konnte festgestellt werden, dass ab etwa 2013 die Anzahl der Berichte 
kontinuierlich abnimmt. Der Grund hierfiir ist unklar. Da nicht von einem techni- 
schen Problem beim Crawlen der Daten ausgegangen werden kann, vermuten wir 
eine Abnahme des Interesses, Geburtsberichte in dieser Form zu verfassen. Diese 
Hypothese muss in den kommenden Jahren gepriift werden. 


85 Besonders im Schweizer Forum sind nicht alle Postings standardsprachlich, sondern es 
wird auch Dialekt verwendet. Es scheint sich allerdings nur um eine Minderheit zu handeln und 
Dialekt wird auch eher in den Antworten und weniger in den Geschichten angewandt. Diese 
Postings wurden nicht gesondert behandelt. Regionalismen und Dialektausdriicke sind dariiber 
hinaus natürlich auch in den ansonsten standardsprachlichen Texten zu finden. 
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7.1.3 Datenaufbereitung 


Im Anschluss an den Download der Daten im HTML-Format wurden sie in XML 
überführt, wobei nur die für die weitere Analyse relevanten Informationen über- 
nommen worden sind: Text und die dazugehörigen und verfügbaren Metadaten 
(Publikationsdatum, Autorin, Titel). 

Danach wurden die Texte mit dem Part-of-Speech-Tagger TreeTagger (Schmid 
1994, 1995) tokenisiert, lemmatisiert und mit Wortartklassen nach dem Stuttgart- 
Tübingen-Tagset (Schiller et al. 1995) versehen. 

Die so aufbereiteten Daten wurden in die Open Corpus Workbench (Evert/ 
The OCWB Development Team 2010) importiert, auf die die weiterführenden Ana- 
lysescripte direkt zugreifen können. 


7.2 Berechnung der narrativen Muster 
7.2.1 Berechnung der n-Gramme 


Wie bereits erwähnt, sollten aus den Daten sogenannte Sprachgebrauchsmuster 
datengeleitet extrahiert werden (Bubenhofer 2009). Darunter verstehe ich Mehr- 
worteinheiten, Wort-n-Gramme, die statistisch gesehen überzufällig häufigin den 
Geburtsberichten vorkommen, wenn man die Daten mit einem Referenzkorpus 
vergleicht (Bubenhofer 2017). Ich berechnete in den Daten komplexe n-Gramme, 
das sind Sequenzen von unmittelbar nacheinander stehenden Wörtern der Länge 
n, wobei n als < 5 definiert ist. Die Ketten bestehen also aus maximal fünf aufei- 
nanderfolgenden Wörtern, wobei die Interpunktion ebenfalls als Wort aufgefasst 
und Satzgrenzen somit auch überschritten werden können. 

Komplex nennen wir dien-Gramme, da sie nicht nur aus Wortformen, sondern 
auch aus lemmatisierten Formen und/oder Wortartklassen bestehen können. Die 
folgenden Berechnungen beruhen auf n-Grammen, die auf den lemmatisierten 
Formen (also Grundformen) beruhen und bei denen Zahlenwerte (Datums-, Zeit-, 
Gewichtsangaben etc.) durch den Platzhalter CARD ersetzt werden. 

Wenn man für alle in einem Korpus definierbaren n-Gramme die Frequen- 
zen berechnet und nach Frequenz absteigend ordnet, stehen an der Spitze eher 
uninteressante n-Gramme, die allgemein häufig vorkommen. Um die für Geburts- 
berichte statistisch auffälligen n-Gramme zu finden, verwenden wir ein Referenz- 
korpus, mit dem die Frequenzen abgeglichen werden. Als Referenzkorpus diente 
ein Zeitungskorpus mit allen Artikeln des Magazins „Der Spiegel“ und der Zeitung 
„Die Zeit“, die zwischen 2010 und 2016 in den gedruckten Ausgaben erschienen 
sind. Es handelt sich hierbei um ein Korpus bestehend aus 53.746 Texten bzw. 
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66.569.194 laufenden Wortformen, einem Teilkorpus des Zeit-Spiegelkorpus, das 
bereits in Abschnitt 6.1.1 beschrieben worden ist. Mithilfe des Referenzkorpus 
können die n-Gramm-Frequenzen nun in den beiden Korpora miteinander vergli- 
chen und einem statistischen Signifikanztest (Log-Likelihood Ratio) unterzogen 
werden; daraus ergibt sich eine Liste von 6941 n-Grammen, die statistisch signi- 
fikant (p < 0,05) für die Geburtsberichte sind oder nur im Geburtsberichte-Korpus 
vorkommen.®® 

Ein Beispiel für ein solches n-Gramm - es handelt sich um das Häufigste 
unter den signifikantesten n-Grammen - ist „an CARD um CARD Uhr“. Dieses auf 
den Grundformen und der Ersetzung von Zahlen mit CARD beruhende n-Gramm 
wird unter anderem folgendermaßen realisiert: 


am 29.5.2010 um 02.23 Uhr 
am 24.09.09 um 0:46 Uhr 
am 31.07.05 um 5:40 Uhr 
am 01.07.2014 um 22.03 Uhr 
am 13.08.2014 um 18.09 Uhr 


Weitere häufige n-Gramme sind „das Licht der Welt erblicken“, „auf den Weg 
machen“ oder „ich habe das Gefühl“. 


7.2.2 Berechnung von Positionen und Abfolgen 


Bislang verfolgten die Berechnungen zwar auf Ebene der Wortformen keinen Bag- 
of-words-Ansatz (vgl. Abschnitt 5.6.2), da wir nicht mit Einzellexemen, sondern 
mit Lexemketten rechnen. Auf Ebene der Texte ist dies allerdings der Fall, da die 
Positionen der n-Gramme in den Geschichten noch nicht berücksichtigt werden. 
Dies aber ist erklärtes Ziel der Studie, deswegen wurden zwei Ansätze auspro- 
biert, um dies zu berücksichtigen. 

1) Positional verortete Daten: Für jedes n-Gramm werden die relativen Posi- 
tionen aller Realisierungen in den Geschichten berechnet. Die Positionsangabe 
bewegt sich zwischen O und 1, wobei 0 den Anfang der Geschichte, 1 das Ende 
markiert. Über alle gefundenen Positionen der Realisierungen eines n-Gramms 
können nun Mittelwert und Streuung über die Standardabweichung vom Mittel- 
wert berechnet werden. Der Mittelwert gibt die typische Position des n-Gramms 


86 Die Daten können unter www.bubenhofer.com/publikationen/geburtsberichte/ (letzter Zu- 
griff: 22.9.2020) abgerufen werden. 
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in den Geschichten wieder; die Standardabweichung zeigt an, ob die Position 
sehr stabil oder eher variabel ist. 

Das n-Gramm „Hallo ihr Lieben, ich“ weist beispielsweise einen Mittelwert 
von 0 und eine Standardabweichung s ebenfalls von O auf, kommt also immer 
am Anfang einer Geschichte vor. Das n-Gramm „der eigentliche ET war“ weist die 
Werte für den Mittelwert 0,06 und die Standardabweichung s 0,1 auf, kommt also 
auch in den ersten Sätzen der Geschichten vor und ist ebenfalls relativ stabil in 
dieser Position. Ganz anders verhält es sich mit dem n-Gramm „CARD das Licht 
der Welt“ mit einem Mittelwert von 0,5 und einer Standardabweichung s von 0,4: 
Diese Formel kommt also an verschiedenen Positionen in den Geschichten vor. 

Zusätzlich zur Berechnung der Positionen wurden im Anschluss die 
n-Gramme noch nach Ähnlichkeit geclustert. Obwohl wir die n-Gramme auf 
Basis der Lemmata (Grundformen) berechnen, ähneln sich viele n-Gramme, da 
sie Varianten voneinander oder von längeren Sequenzen darstellen. Das sieht 
man an folgendem Beispiel: 


Uhr sein wir in KH. 
Uhr sein wir in KH 
sein wir in KH ankommen 
sein wir in KH und 


Um solche n-Gramme gruppieren zu können, führten wir eine Clusteranalyse 
anhand der übereinstimmenden Lexeme in den n-Grammen durch. Die n-Gramme 
wurden dafür in Vektoren überführt, die angeben, welche Lexeme darin vorkom- 
men (1) oder nicht vorkommen (0). Anschließend wurde die euklidische Distanz 
als Grundlage für ein hierarchisches Clustering nach der Ward-Methode mit R 
angewandt. Im Ergebnis erhält man Gruppen ähnlicher n-Gramme sowie die 
Ordnungsnummer des n-Gramms im Clusterdendrogramm. Diese reicht als Ord- 
nungskriterium aus, um die Cluster nach Ähnlichkeit gruppieren zu können. 

2) Kollokationsansatz: Ein zweiter Ansatz (analog zu Bubenhofer et al. 
2013) fasst die Frage der Sequenzen der n-Gramme als Kollokationsproblem auf: 
Zu den jeweiligen n-Grammen wird berechnet, welche anderen n-Gramme links 
oder rechts davon signifikant kollokieren, also zusammen vorkommen. Daraus 
ergeben sich dann Ketten von n-Grammen. 


7.3 Visuelle Analyse-Praktiken 


Die gemäß den Berechnungen (vgl. Abschnitt 7.2) entstandenen Daten sind sehr 
umfangreich und entziehen sich einer direkten Analyse. Daher standen bald 
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Überlegungen im Zentrum, die Daten zu visualisieren, um sie überblick- und 
interpretierbar zu machen. Ziel war also, wie bereits bei den Geokollokationen 
(vgl. Abschnitt 6.2), explorative Visualisierungen zu erstellen, die die Analyse 
unterstützen. Bereits in der Vorgängerstudie (Bubenhofer et al. 2013) verwende- 
ten wir dafür Netzgraphen, um die narrativen Muster zu entdecken. 

Zunächst möchte ich nun die Visualisierungen der Daten vorstellen, dienach 
der ersten der beiden Berechnungsmethoden entstanden ist. Bei dieser Methode 
(positional verortete Daten) liegen zu den n-Grammen Angaben über ihre relati- 
ven Positionen in den Geschichten vor. Danach führe ich die Arbeiten zur zweiten 
Berechnungsmethode aus, die mit Kollokationen arbeitet (Kollokationsansatz; 
vgl. zu den Methoden Abschnitt 7.2.2). 


7.3.1 Visualisierungen zu den positional verorteten Daten 


Diagrammatische Transformationen kommen bereits relativ früh nach der 
Berechnung der grundlegenden Daten ins Spiel: Die Berechnung der Positionen 
geht von der Liste der für die Geburtsberichte typischen n-Gramme aus. Diese 
n-Gramme sind ja abstrakte, auf die Grundformen reduzierte n-Gramme wie 
etwa: 


[lemma=“Muttermund“] [lemma=“sein“] [lemma=“2“] [lemma=“cm*“] 
[lemma=“offen‘] 


Wenn man nach diesem abstrakten n-Grammen sucht, finden sich eine Reihe von 
n-Gramm-Types, also die flektierten Realisierungen in den Texten: 


16x: Muttermund war 2 cm offen 
3x: muttermund war 2 cm offen 
2x: Muttermund ist 2 cm offen 
1x: Muttermund sei 2 cm offen 


Jeder nach flektierten Formen unterschiedene n-Gramm-Type verweist auf eine 
bestimmte Zahl von n-Gramm-Tokens in den Daten. Für jedes n-Gramm-Token 
wird die relative Position im jeweiligen Text berechnet und abgespeichert. 


87 Die Notation des Beispiels erfolgt in der Abfragesprache CQP, mit der in der Corpus Work- 
bench abgefragt werden kann. „lemma“ zeigt an, dass die Abfrage für jedes Token (in eckigen 
Klammern) auf Lemmabasis erfolgt. 
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Dadurch entstehen mehrdimensionale Daten, die sehr gut in einer relationalen 
Datenbank repräsentiert werden können. Das abstrakte n-Gramm verweist dabei 
jeweils auf die n-Gramm-Types und diese wiederum auf die n-Gramm-Tokens mit 
den jeweiligen Metadaten zu jedem n-Gramm-Token. 

Wir verwenden eine PostgreSQL-Datenbank für die Verwaltung der Daten 
und benutzen vier Tabellen, um die Informationen abzulegen. 


ngrams examples 
id id 
[Ingram] idNgram 
frequency — [ngram] 
pValue frequency 


textpos_mean 


textpos_stddev 


examplesMetadata metafields 
idExample id 

idNgram name 
idMetafield — 


value 


Abb. 85: Tabellenstruktur der Datenbank nGrams (vereinfachte Darstellung) 


Abbildung 85 zeigt die Tabellenstruktur der Datenbank. Die Tabelle „ngrams“ 
listet die abstrakten n-Gramme auf und enthält auch statistische Informationen 
zu den n-Grammen. Diese Tabelle ist mit „examples“ verknüpft: Dort umfasst 
jeder Eintrag einen n-Gramm-Type und verweist über „idNgram“ auf das abs- 
trakte n-Gramm, auf das sich der Eintrag bezieht. Schließlich gibt es die Tabelle 
„examplesMetadata“, die für jedes n-Gramm-Token gleich mehrere Einträge 
umfasst: Sie ist mit der Tabelle „metafields“ verknüpft, die für jedes mögliche 
Metadatenfeld einen Eintrag umfasst, also z. B. Autor/in, Datum, Titel und eben 
auch den Belegtext. In der Tabelle „examplesMetadata“ existiert nun pro Beleg 
für jedes mögliche Metadatum ein Eintrag, der über die IDs auf das dazugehörige 
abstrakte n-Gramm und den n-Gramm-Type verweist.®® 


88 Es muss betont werden, dass dies nur eine mögliche Datenbankstruktur ist, um die Daten 
abzulegen. Sie ist zudem dem relationalen Datenbankparadigma verpflichtet. Es handelt sich 
hier um eine ideologische Entscheidung für eine Coding Culture, die auch anders hätte getroffen 
werden können. 
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Die Tabellenstruktur der Datenbank ist, obwohl sie nur vier Tabellen umfasst, 
bereits so komplex, dass eine grafische Benutzeroberfläche für die einfa- 
che Abfrage erstellt werden muss. Dies erfüllt der „nGrams-Viewer“, ein 
PHP/Javascript-Interface im Webbrowser, das auf die Datenbank zugreift. Abbil- 
dung 86 zeigt eine Ansicht des Interfaces bei dem ausgewählten Datensatz der 
n-Gramme in den Geburtsberichten. 
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Abb. 86: nGrams-Viewer als hierarchische Liste (vgl. https: //korpuspragmatik.ds.uzh.ch > 
nGrams-Viewer, zuletzt geprüft: 22.9. 2020) 


In der Abbildung ist zunächst eine Liste der abstrakten n-Gramme ersichtlich - 
in Kombination mit den verfügbaren Metadaten wie Signifikanzniveau, Frequenz 
und insbesondere mittlere Position und Standardabweichung der Positionen. 
Nach all diesen Kriterien kann die Liste auch sortiert werden. 

Durch Klicken auf ein abstraktes Muster wird im Hintergrund die dazugehö- 
rigen n-Gramm-Types aus der Datenbank abgerufen, so dass sofort ersichtlich ist, 
wie viele Flexionsvarianten mit welchen Frequenzen in den Daten vorhanden 
sind. Ein weiterer Klick auf eine dieser Varianten zeigt nun alle Belege (n-Gramm- 
Tokens) für diese Variante mit den dazugehörigen Metadaten. Mit weiteren Klicks 
kann man die Auffächerung wieder rückgängig machen. 

Die mit dieser Ansicht verbundenen diagrammatischen Grundfiguren sind 
die Liste und der Baumgraph, der für die hierarchische Auffächerung der Liste 
sorgt. Es wäre möglich, die Liste auch grafisch als Baumgraph darzustellen, da 
aber auf der ersten Ebene die abstrakten n-Gramme sortiert werden können, fügt 
sich die Baumgraph-Struktur in die Liste ein. 

Im Zusammenhang mit dieser Struktur muss noch auf eine technische Beson- 
derheit verwiesen werden: Web-Anwendungen waren lange davon geprägt, dass 
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zur Veränderung eines Benutzerinterfaces die Webseite neu aufgebaut werden 
musste. Typischerweise wurde mit einem Klick auf eine Schaltfläche ein Befehl 
ausgelöst, der die Seite neu lud und damit die gewünschten Informationen 
anzeigte. Seit einiger Zeit ist dies mit der Einführung von „AJAX“, „Asynchronous 
JavaScript and XML“, nicht mehr nötig (Garrett 2008). Diese technische Erfin- 
dung war eine wichtige Voraussetzung für neue Benutzerinterfaces und wird 
auf einer Schulungsseite als „a developer’s dream“? bezeichnet, weil man nun 
die Seite aktualisieren kann, ganz ohne sie neu laden zu müssen. Der nGrams- 
Viewer benutzt ebenfalls AJAX-Technologie, um zu den abstrakten n-Gramms die 
Daten für die n-Gramm-Types und dann wieder die n-Gramm-Tokens bei Bedarf 
nachladen zu können. Die typische Forderung der Visual Analytics, das Dogma 
von Ben Shneiderman „Overview first, zoom and filter, then details-on-demand“ 
(Shneiderman 1996), wird somit überhaupt erst praktikabel umsetzbar.?® AJAX ist 
somit ein weiteres Beispiel für eine technische Innovation, die beliebt wird und 
somit das Aussehen und die Funktionsweise von Benutzerinterfaces verändert 
und prägt. AJAX ist damit ein wichtiges Element einer Coding Culture, in die man 
sich einfügt, wenn man eine solche Technologie nutzt. 

Die Liste der n-Gramme kann im nGrams-Viewer nach Position aufsteigend 
sortiert werden, womit ein erster Eindruck über die sequenzielle Anordnung der 
n-Gramme gewonnen werden kann. Damit ist jedoch kein Überblick über die 
Verteilung der n-Gramme auf die verschiedenen Positionen möglich. Dies leistet 
hingegen ein klassisches Streudiagramm (diagrammatische Grundfigur Vektor) 
wie in Abbildung 87. 

In Abbildung 87 stehen die Punkte für die abstrakten n-Gramme. Sie werden 
über die zwei Dimensionen Position in der Geschichte (x-Achse) und Standard- 
abweichung der Position (y-Achse) auf der Fläche angeordnet. Die Punktgröße 
repräsentiert darüber hinaus eine dritte Dimension: Die Frequenz des n-Gramms. 

Je weiter oben auf der y-Achse ein Punkt angeordnet ist, desto stärker vari- 
iert die Position des n-Gramms. Weiter ist eine Trendlinie (schwarz) eingezeich- 
net, die die Korrelation zwischen Position und Standardabweichung zusam- 
menfasst. Diese beschreibt einen sogenannten Brückenbogen, was bedeutet, 
dass besonders am Anfang und am Ende der Geschichten n-Gramme vorkom- 
men, die bezüglich ihrer Position stabil sind, wobei die Anfänge noch stabiler 
als die Enden sind. N-Gramme wie „eigentlicher ET war der [Datumsangabe]“ 


89 Vgl. https://www.w3schools.com/xml/ajax_intro.asp (22. 9.2020). 

90 Das Dogma wäre auch ohne AJAX umsetzbar, wenn man vorgängig alle Daten laden und bei- 
spielsweise über Javascript/CSS-Manipulationen erst im Nachhinein aufdecken lassen würde. 
Dieses Vorgehen ist aber aufgrund der großen Datenmengen oft nicht praktikabel. 
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Abb. 87: Die Verteilung (typische Positionen) der n-Gramme in den Geburtsberichten (Korrela- 

tion von durchschnittlicher Position und Standardabweichung; Daten: Geburtsgeschichten aus 
Online Foren, die häufigsten 1609 n-Gramme; vgl. www.bubenhofer.com/visuallinguistics/ für 
eine interaktive Version) 


oder „hier noch die Daten:“ variieren in ihren typischen Positionen in den 
Geschichten kaum und erscheinen fast immer ganz am Anfang bzw. am Ende 
der Geschichten. 

Die Grafik zeigt auch, dass eine große Menge der n-Gramme bezüglich Posi- 
tion unspezifisch ist und darum dazu tendieren, als Mittelwert 0,5 und eine Stan- 
dardabweichung um 0,2 einzunehmen. Dies sind n-Gramme, deren positionale 
Informationen wenig Bedeutung tragen. Fin Beispiel dafür ist „das Licht der Welt 
erblickt“, das an verschiedenen Positionen erscheint. 

N-Gramme repräsentierende Punkte an speziellen Positionen auf der Fläche, 
also besonders stabile und besonders instabile, sind beschriftet, so dass sie 
gelesen werden können. Diese Lösung der selektiven Beschriftung ist natür- 
lich der Statik des Diagramms geschuldet. Wir erstellten daher eine interaktive 
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Version davon, bei der die Beschriftung bei Berührung der Punkte mit der Maus 
angezeigt wird.” 

Beide Darstellungen, die des nGramViewers als auch diese der Verteilung, 
können den Effekt der Desequenzialisierung rückgängig machen. Die Listen- 
darstellung des nGramViewers leistet dies insofern, als sie nach Position der 
n-Gramme geordnet werden kann. Beim Streudiagramm oben wird Sequenz auf 
der x-Achse grafisch abgebildet. 


Geburtsberichte: typische n-Gramme (Top 481) 
Noah Bubenhofer, Universität Zürich 


Abb. 88: Dreidimensionale Darstellung der n-Gramme in den Geburtsberichten 


Vom zweidimensionalen Streudiagramm ausgehend, liegt es nahe, eine dritte 

Dimension nicht grafisch als Punktgröße zu visualisieren, sondern eine dreidi- 

mensionale Darstellung mit einer z-Achse zu nutzen. Dies leistet eine interaktive 

Visualisierung, von der in Abbildung 88 ein Bildschirmfoto abgebildet ist.?? Die 

drei Achsen repräsentieren folgende Werte: 

— x-Achse: relative Position des n-Gramms 

—  y-Achse: Frequenz des n-Gramms 

—  z-Achse: Ähnlichkeit der n-Gramme auf Wortformen-Ebene aufgrund der 
Clusteranalyse 


91 Vgl. dazu die begleitende Website www.bubenhofer.com/visuallinguistics/. 
92 Sie ist ebenso auf der begleitenden Website www.bubenhofer.com/visuallingistics/ einseh- 
bar. 
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Im Koordinatensystem werden die n-Gramme als Punkte dargestellt und beschrif- 
tet, wofür aber nicht das abstrakte n-Gramm, sondern die häufigste Realisierung 
(n-Gramm-Type) verwendet wird, um die Lesbarkeit zu verbessern. Da das Dia- 
gramm interaktiv ist, kann gedreht und gezoomt werden. Zudem werden bei 
Berührung der Punkte weitere statistische Informationen zum n-Gramm angege- 
ben. Abbildung 89 zeigt ein Beispiel, welche Informationen für jedes n-Gramm 
verfügbar sind. Dies sind: Abstrakte Form des n-Gramms, häufigstes Exemplar, 
durchschnittliche Position, Frequenz und Cluster-Rang. 


n-Gram: flemma="an"] flemma="@card@ 7 llemma="um"] flemma="@card@ ‘J [lemma="Uhr”] 
PRERE E, häufigstes Exemplar: Am 13.05.2013 um 8:22 Uhr (1/ 847) 


Durchschnittliche Position: 0.598681646022055 
Frequenz: 847 (6.74170069465205 ) 
| Cluster-Rang: 4044 
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Abb. 89: Dreidimensionale Darstellung der n-Gramme in den Geburtsberichten: Weiterfiihrende 
statistische Informationen 


Die dreidimensionale Darstellung funktioniert nur als interaktive Version, bei 
der Interaktion und Betrachtung von derselben Person vorgenommen werden: 
Wie jede dreidimensionale Darstellung auf der Fläche, ist die Dreidimensionali- 
tät nur simuliert und die prinzipiell im Hintergrund verfügbare Information über 
die Position im dreidimensionalen Raum muss auf eine Fläche projiziert werden. 
Diese Projektion ist nur dann gut erfassbar, wenn Dreh- und Kippbewegungen 
gemacht werden können. Dann ist es aber möglich, die dreidimensionale Darstel- 
lung nach Belieben zu kippen und zu drehen, um die Gewichtung der Achsen zu 
verändern: Aus der Perspektive von schräg vorne sind alle drei Achsen ähnlich 
stark gewichtet. Kippt man nun die Darstellung leicht, so dass man sie von oben 
erblickt, verschwindet die y-Achse weitgehend und die n-Gramme sind primär 
nach den Dimensionen Position (x-Achse) und Ähnlichkeit (z-Achse) gegliedert. 
Durch entsprechende Bewegungen können andere Achsenpaare betont werden. 
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Der Gewinn einer dreidimensionalen Darstellung liegt also darin, dass eine 
relativ holistische Sicht auf drei Dimensionen möglich ist, allerdings nur dann, 
wenn die Darstellung bewegt werden kann und man sich zwischen stark zwei- 
dimensional geprägten Vorder-, Drauf- und Seitenansichten — die je spezifische 
Perspektiven auf die Daten bieten — hin und her bewegen kann. 

Wie jedes Streudiagramm leistet auch diese Darstellung durch die Verräum- 
lichung - hier im dreidimensionalen Raum - eine Dimensionsanreicherung, da 
Korrelationen zwischen den drei Faktoren Position, Häufigkeit und Ähnlichkeit 
sichtbar werden. Interessant ist dabei insbesondere die Korrelation zwischen 
Position und Ähnlichkeit, wobei letztere ein Ergebnis der Clusteranalyse ist. Von 
den Ergebnissen der Clusteranalyse wird der Ordnungsrang des hierarchischen 
Dendrogramms als Kriterium verwendet, d.h. danach geordnet präsentieren sich 
die n-Gramme auf einer „Ähnlichkeitspalette“, bei der benachbarte n-Gramme 
immer als ähnlich zueinander in Relation gesetzt werden. Durch die Korrelation 
mit den Positionen wird diese Ordnung nun aufgebrochen und mit zweitem Kri- 
terium nach Position geordnet. Die beiden Ansichten, die den Zusammenhang 
zwischen Position und Frequenz betonende Vorderansicht und die den Zusam- 
menhang zwischen Ähnlichkeit und Position betonende Draufsicht, verdeutli- 
chen diesen Effekt (vgl. Abbildung 90). 

Allerdings möchte ich an dieser Stelle betonen, dass die Kenntnisse über 
diesen Effekt weder neu sind noch die präsentierte Visualisierung besonders 
innovativ ist. So ist es das Wesen von Streudiagrammen, durch räumliche Anord- 
nung von Korrelationen, eben jene sichtbar zu machen und dabei einen Mehr- 
wert gegenüber statistischen Zusammenfassungen zu leisten.” Wichtig ist mir 
hier die Perspektive der Sequenzialität und die damit verbundene Erkenntnis, 
dass diese für bestimmte Forschungsfragen absolut essentiell ist. Im Fall der 
Korrelation zwischen Ähnlichkeit und Position (untere Darstellung in Abbildung 
90) ist beispielsweise sichtbar, dass es dichte Cluster von n-Grammen gibt, die 
bezüglich Position der Geschichte sehr stabil sind und wie diese auf die Verläufe 
der Geschichten verteilt sind: Formulierungen der Art „ET war der CARD“ (und 
Variationen) sind als solcher Fall unten links (in der Abbildung mit 1 markiert) 
als dichter Cluster sichtbar — und dieser Cluster ist allerdings bei den Anfängen 


93 Diese Kraft des Diagramms demonstriert Edward Tufte in seinem Klassiker „The Visual Dis- 
play of Quantitative Information“ (Tufte 1983, 14) besonders eindrucksvoll, indem er vier Da- 
tensätze von je elf x- und y-Werten zeigt, deren deskriptiv-statistischen Werte alle gleich sind 
(Mittelwerte, Regressionslinien, Korrelationskoeffizient etc.). Wenn man die Werte aber in Streu- 
diagrammen plottet, werden die Unterschiede der Datensätze bezüglich ihrer Korrelationstypen 
(positiv gestreut, linear, Ausreißer etc.) sofort evident. 


Visuelle Analyse-Praktiken — 261 


oo Ähnächkeit 
0 


Am 13.08.2013 um 8:22 Ue 


ET wer gy 26.13 


che ET way Gor 27.10.2006 


Frequenz (to) 40 
2 
2006 
5 menen Gatrtsbarit ru oravan 
) den 24.08 oma ich auch niita Lieten „ich 
ien einan Termin be ~ $ 
aii 
as 
os os oe o? ° 
Position im Text 
Position im Text 

o 0.2 0.4 0.6 os 

7000 
Tech war eint alias In stern var 
nach EN bas une 
6000 > ’ an, als 
s000 
4000 
Ähnlichkeit 
3000 
2000 
1000 
5 
5.5 
o 6 
gẸ&equenz (log) 


Abb. 90: Vorder- und Draufsicht der dreidimensionalen Darstellung offenbaren unterschiedliche 
Zusammenhänge. 


der Geschichten eher die Ausnahme. Es gibt keine weiteren dichten Cluster in 
diesem Bereich. Die Mitte wiederum ist stark von solchen Clustern durchdrun- 
gen, etwa vom „auf dem Weg machen“-Cluster gegen Ende des ersten Drittels der 
Geschichten (mit 2 markiert). Ein weiterer Cluster befindet sich gegen Ende um 
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Formulierungen wie „auf den Bauch gelegt“ oder „auf die Brust gelegt“ (mit 3 
markiert). Das bedeutet auch, das die Anfänge der Geschichten generell etwas 
weniger positional stabile n-Gramme enthalten, diese aber, wenn sie genannt 
werden, bezüglich ihrer Form kaum variieren (mit Ausnahme der ET-Formulie- 
rungen). Gegen Ende ist das anders: Dort gibt es mehrere solche Gemeinplätze, 
die aber formal variieren. 

Korrelationen dreier Dimensionen müssen nicht zwingend in einem drei- 
dimensionalen Streudiagramm dargestellt werden. Stattdessen kann man auch 
sogenannte „Small Multiples“ (Tufte 1983, 170) verwenden, bei denen eine Reihe 
von zweidimensionalen Diagrammen nebeneinander gestellt wird und auf diese 
Weise den direkten Vergleich erlauben. Dafür muss allerdings die dritte Dimen- 
sion nominal skaliert sein. Ein Beispiel dafür ist Abbildung 91, bei der die Korre- 
lation zwischen Position und Wortartfrequenz dargestellt ist. Inhaltlich gesehen 
ist bei diesen Daten beispielsweise auffallend, das Adjektive (ADJA) ungleich 
verteilt sind und dazu tendieren, hauptsächlich am Anfang und am Ende der 
Geschichten verwendet zu werden. Ähnlich verhalten sich beispielsweise Zahl- 


ADJA APPRART CARD ITJ 


Dichte 


0.00 0.25 0.50 0.75 1.00 


PTKANT VMFIN VVFIN 


0.0- 1 1 r 1 r 1 1 1 1 % r 1 1 1 1 
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Abb. 91: Small Multiple-Diagramm Dichteverteilung Wortarten (n = 3074387) 
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wörter (CARD) und Possessivpronomen (PPOSAT), gegensätzlich „um zu“ + Infi- 
nitiv-Konstruktionen (KOUI) und Verbformen (VMFIN, VVFIN). Präpositionen mit 
Artikel (APPRART: im, am, ins, zum, zur...) werden zu Beginn viel stärker ver- 
wendet und fallen dann ab - ein Zeichen dafür, dass am Anfang temporale und 
lokale Situierungen vorgenommen werden (vgl. für weiterführende Analysen und 
Deutungen dazu Bubenhofer 2018b). 

Allen Visualisierungen in diesem Abschnitt gemein ist, dass zwar Positionen 
der n-Gramme dargestellt werden, jedoch nicht im eigentlichen Sinn Sequenzia- 
lität. Diese wird aus den Positionen heraus als aggregierte Information heraus- 
gelesen, aber die Position eines bestimmten n-Gramms A links eines n-Gramms 
B bedeutet nicht zwingend, dass in den einzelnen Geschichten tatsächlich eine 
Sequenz A > B vorhanden ist. Es bedeutet nur, dass in den Geschichten A immer 
wieder an einer früheren Position als B genannt wird — das muss aber nicht in den 
gleichen Geschichten der Fall sein. 

Um näher an Sequenzialität zu gelangen, wählten wir den Kollokationsan- 
satz und versuchten, diese Daten zu visualisieren, was im nächsten Abschnitt 
dargestellt wird. 


7.3.2 Visualisierungen zum Kollokationsansatz 


In unserer früheren Publikation zu narrativen Mustern in Geschichten Jugendli- 
cher zum „Ersten Mal“, die sie in Webforen publiziert hatten, verwendeten wir 
u.a. eine Graphdarstellung, um typische Sequenzen von n-Grammen darzustel- 
len (vgl. Abbildung 92, S. 264). 

Der Narrationsgraph ist grundsätzlich gerichtet, indem die Erzählung von 
oben nach unten fortschreitet. Die Knoten sind typische n-Gramme und die 
Kanten zeigen an, welche n-Gramme miteinander kollokieren. Nebeneinander 
stehend sind n-Gramm-Verkettungen aufgeführt, die voneinander unabhängig, 
aber an ähnlichen Positionen erscheinen. Der Graph zeigt Verdichtungsbereiche 
von musterhaftem Sprachgebrauch (im Graph grau hinterlegt). Darunter fällt bei- 
spielsweise ein Muster, das auf die Dauer der Beziehung referiert: 


# Monate mit meinem - Monate mit meinem Freund — # Wochen mit meinem - mit meinem 
Freund zusammen - # Monate mit ihm - Monate mit ihm zusammen (Bubenhofer et al. 
2013) 


Im Verbund mit weiteren Analysen und Darstellungen ist es möglich, typische 
narrative Muster dieser Alltagserzählungen zu deuten. 
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Abb. 92: Narrationsgraph der Erzählungen der Frauen zum „Ersten Mal“ (Bubenhofer et al. 
2013, Grafik: Joachim Scharloth) 


Auf der Basis dieses Visualisierungsansatzes versuchten wir weiter zu arbeiten. In 
enger Zusammenarbeit mit Katrin Affolter entstand in der Folge eine interaktive 
Browser-Anwendung, um narrative Strukturen zu visualisieren (Affolter 2016b). 
Abbildung 93 zeigt die Arbeitsoberfläche von NarrViz, einer Javascript- 
Anwendung. Sichtbar ist eine Graphdarstellung, die primär einer horizontalen, 
sekundär einer vertikalen Ausrichtung folgt. Auf der horizontalen Achse ist der 
Verlauf der Geschichten abgetragen, wobei die Geschichten in eine (frei definier- 
bare) Anzahl gleichmäßiger Teile aufgeteilt werden. Jeder Teil ist durch eine (mit 
Farbe codierte) Spalte repräsentiert. Die Knoten stehen für die n-Gramme und die 
Kanten zeigen an, welche miteinander in einer statistisch signifikanten Assozia- 
tion stehen. Die Visualisierung ist zoombar. Je nach Einstellungen und Darstell- 
barkeit werden die Knoten mit den sie repräsentierenden n-Grammen beschriftet. 
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Abb. 93: Oberflache von NarrViz zur Visualisierung narrativer Strukturen (in Zusammenarbeit 
mit Katrin Affolter 2016b). 
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Abb. 94: NarrViz Info-Panel 
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Für jeden Knoten sind eine Reihe von Informationen verfügbar, die angezeigt 
werden, wenn er berührt wird (siehe Abbildung 94). Zum abstrakten (lemmati- 
sierten) n-Gramm werden die flektierten n-Gramm-Types mit Frequenzinforma- 
tionen angegeben. Zudem wird im unteren Bereich bei „Most Probable Path“ ein 
Pfad durch das Netz von n-Grammen angezeigt, der die stärksten Assoziationen 
aufweist (und der in der Visualisierung auch sichtbar wäre). Die farbliche Codie- 
rung verweist auf die Teile, in denen die n-Gramme vorkommen. 

Das Problem der Streumöglichkeit der berechneten Position wird mit einem 
Boxplot visualisiert: Dieser kanonische Diagrammtyp zeigt an, in welchem 
Bereich sich das 2. und 3. Quartil der Daten bewegt, also die Hälfte der Daten 
um den Mittelwert herum (blaue Box). Der Strich ungefähr in der Mitte der Box 
zeigt die Position des Mittelwertes an (Teil 6) - die Hälfte der Daten bewegt sich 
zwischen den Teilen 4 und 7. Mit den über eine gepunktete Linie verbundenen 
Querstriche oben und unten werden Ausreißer angezeigt, also Positionen des 
n-Gramms, die sehr untypisch sind. 

Bei einem Graph können netzwerkstatistische Angaben gemacht werden. Im 
Info-Panel unterhalb der Nennung des abstrakten n-Gramms werden dazu neben 
Frequenz und Signifikanzniveau des n-Gramms im Vergleich zum Referenzkor- 
pus die Gradzentralität mit der Anzahl eintreffender (in-degree, 5-) und ausge- 
hender (out-degree, 5*) Verbindungen angegeben. Je höher diese Zahlen, desto 
zentraler ist der Knoten im Netz. 

Ein Problem der Positionierung der Knoten (als Repräsentationen der 
n-Gramme) ist, wie bereits erwähnt, deren Streuung: Die Platzierung suggeriert 
eine exakte Position des Knotens an einer bestimmten Stelle der Geschichten. 
Wie der Boxplot pro Knoten aber jeweils zeigt, kann die Position aber sehr unbe- 
stimmt sein und sich über einen größeren Bereich erstrecken. 

Um diese Information grafisch umzusetzen, experimentierten wir mit einer 
alternativen Darstellung, mit der die Knoten ab einem bestimmten Schwellwert 
der Standardabweichung im unteren Bereich des Arbeitsfensters als horizon- 
tale Balken dargestellt werden (sogenannte „Distributionsdifferenz“, vgl. Abbil- 
dung 95). Die Balkenlänge markiert dabei die Grenzen des 2. und 3. Quartils, wie 
das der Boxplot im Info-Panel ebenfalls macht. Dadurch wird deutlich, welche 
n-Gramme bezüglich ihrer Position variabel sind. Der Schwellwert, ab dem 
Knoten so dargestellt werden, kann von der Benutzerin eingestellt werden. 

Die berechneten Kollokationsdaten können mitunter sehr umfangreich sein. 
Daher ist es wichtig, dass die Darstellung beeinflusst werden kann, indem die 
Daten nach verschiedenen Kriterien gefiltert werden können. Das geschiehtin den 
Filter-Einstellungen, wo Minimal- und Maximalfrequenz der angezeigten Knoten 
und Kanten (basierend auf den Häufigkeiten des n-Gramms) und der Schwellwert 
des Signifikanzniveaus, ab dem die Kanten dargestellt werden sollen, festgelegt 
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Abb. 95: Darstellung von positional wenig fixierten (Knoten mit Balken) und fixierten (Knoten) 
n-Grammen in NarrViz. 


NarrViz 


Abb. 96: NarrViz Einstellmöglichkeiten (Filterung). 
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werden können. Ebenso in diesem Bereich wird die Distributionsdifferenz defi- 
niert, ab der Knoten als Balken im unteren Bereich dargestellt werden sollen. 

Weitere Einstellmöglichkeiten betreffen Optionen zur Darstellung des Info- 
Panels und des gesamten Layouts. So können etwa die Farben, Schriftgrößen, 
Strichdicken und Distanzen zwischen den die Teile repräsentierenden Spalten 
festgelegt werden. 

Schließlich muss noch der Ladevorgang der Daten thematisiert werden: 
Die Anwendung ist so gestaltet, dass beliebige, dem nötigen Datenformat ent- 
sprechende Daten, die lokal auf dem eigenen Rechner vorliegen, geladen und 
dargestellt werden können. Die Daten müssen in einem genau definierten JSON- 
Format vorliegen. Eine Reihe von Python-Scripts berechnet die Kollokationen auf 
der Basis eines Korpus, das in der Corpus Workbench abgelegt ist. Diese Python- 
Scripts erstellen die Daten im geforderten Format. Nach dem Import der Daten in 
NarrViz wird die Graphdarstellung aufgebaut, wobei beobachtet werden kann, 
wie sich die Ordnung des Graphen aus den zunächst ungeordneten Daten ergibt. 
Abbildung 97 zeigt zwei Zustände, die zeigen, wie sich das Layout nach ein paar 
Iterationen stabilisiert. 


Abb. 97: Genese des Layouts der Graphdarstellung in NarrViz nach Import der Daten. 


Dieser Effekt müsste nicht dargestellt werden, wie bereits in Abschnitt 5.5.4 the- 
matisiert, und ist eher ein Zeichen für den Einfluss einer Coding Culture: Die 
Darstellung benutzt die Javascript-Bibliothek D3 und die dabei zur Verfügung 
stehende Graphfunktion, die diesen Animationseffekt standardmäßig zur Verfü- 
gung stellt. Sie zu verwenden ist nicht abwegig, da damit visualisiert wird, dass 
der Graph aufgrund der Daten kein folgerichtiges Layout mitbringt, sondern 
dieses hinsichtlich eines bestimmten Zweckes definiert werden muss. Es könnte 
aber auch mit Recht darauf verwiesen werden, dass es sich hierbei um eine unnö- 
tige Spielerei handelt. Es gehört jedoch zu dieser spezifischen Coding Culture, die 
dynamische Anzeige von Daten zu ermöglichen, daher befördert sie die Benut- 
zung dieser Funktion. 
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7.4 Analysepraxis narrative Muster 


Im vorliegenden Bericht zur Analyse der Geburtsberichte sollen die inhaltlichen 
Erkenntnisse nicht im Vordergrund stehen. Trotzdem möchte ich kurz darauf 
eingehen, wie die Analyse der Daten mit Hilfe der visuellen Analysewerkzeuge 
erfolgte und einige Erkenntnisse umreißen (vgl. aber für eine ausführlichere Dar- 
stellung der Analyseergebnisse Bubenhofer 2018b). 


7.4.1 Datengeleitetes Vorgehen 


Die Visualisierungs-Werkzeuge der beiden gewählten Ansätze zur Analyse der 
Geburtsberichte (positional verortete Daten und Kollokationsansatz) legen eine 
datengeleitete Analyse nahe. Datengeleitet bedeutet in diesem Zusammenhang 
nicht theorie- oder prämissenlos, denn eine Prämisse war ja, dass positionale 
oder sequenzielle Informationen zu Sprachgebrauchsmustern, operationalisiert 
als Wort-n-Gramme, Indikatoren für narrative Muster sind. Wenn man sich die 
reichen Arbeiten zu narrativen Theorien vor Augen führt, wird aber deutlich, 
dass dieses Vorgehen im Vergleich dazu theorielos ist, denn Ausgangspunkt sind 
Sprachgebrauchsmuster in Daten und ihre sequenzielle oder positionale Anord- 
nung, woraus sich Hypothesen über narrative Muster ableiten lassen. Ausgangs- 
punkt ist also nicht bereits ein Raster an Erzählfunktionen, die aus einer Erzähl- 
theorie abgeleitet wären. Vielmehr sollen solche Erzählfunktionen datengeleitet 
rekonstruiert werden. 

Bei der Graphdarstellung in NarrViz fallen bei der Analyse zunächst zent- 
rale Knoten ins Auge, die viele Verbindungen zu anderen Knoten aufweisen und 
gleichzeitig für häufig vorkommende n-Gramme stehen. Abbildung 98 (s. u. S. 
270) zeigt einen Ausschnitt aus der Graphdarstellung, bei dem einer der zent- 
ralsten (und gleichzeitig häufigsten) Knoten, „das Licht der Welt erblickt“”“, her- 
vorgehoben ist. Diese Formulierung ist - aufgrund ihrer Zentralität beim Vorgang 
der Geburt nicht weiter verwunderlich - auch ein zentraler Bezugspunkt der 
Erzählungen. 

Aber auch weniger offensichtliche Formulierungen wie „ich bin froh, dass“, 
„dass ich nicht mehr“ oder „ich hatte das Gefühl“ sind häufig wiederkehrende 
und damit zentrale Knoten. 


94 Ich nenne hier und im Folgenden der besseren Lesbarkeit wegen jeweils anstelle des abstrak- 
ten, lemmatisierten n-Grammes die flektierte Realisierung, also ein n-Gramm-Type (normaler- 
weise den häufigsten). 
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Abb. 98: NarrViz Geburtsberichte: Zentrale Knoten. 


Knoten mit vielen Verbindungen an den Anfängen und Enden, die auch eher 
stabilere Positionen innehaben, sind Indizien für die phraseologisch festeren 
Anfangs- und Beendigungssequenzen in den Geschichten. Die Formel „haben 
mein Mann und ich“ am Anfang oder „alles in allem war es“ am Ende sind Bei- 
spiele dafür. 

Durch die Integration der Ähnlichkeit der n-Gramme als weitere Dimen- 
sion ist die dreidimensionale Darstellung des positionalen Ansatzes eine wich- 
tige Quelle, um wichtige erzählerische Momente - ich nenne sie „erzählerische 
Topoi“, also „Orte“, die in der Erzählung angesteuert werden - sichtbar zu 
machen und erkennen zu können. Abbildung 99 zeigt eine Reihe von solchen 
Topoi, die sich durch Cluster von n-Grammen auszeichnen, beschriftet mit Ad- 
hoc-Bezeichnungen als erstem interpretatorischen Zugriff. 
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Abb. 99: Auffallige Momente in den Geburtsberichten (datengeleitete Perspektive) 


In Kombination mit weiteren datengeleiteten Analysen, wie etwa zur Dichtever- 
teilung von Wortartklassen (vgl. Abbildung 91) oder auch hier nicht erwähnten 
semantischen Klassen (Bubenhofer 2018b), ergibt sich ein Bild von typischen 
Erzählweisen in den Geburtsberichten, die von narrativen Topoi geprägt sind. 
Dazu gehören narrative Topoi wie etwa ganz zu Beginn der Geschichten, die 
Ansprache der Leserschaft und die Motivierung der Narration, die temporale 
Situierung, später Topoi der Selbstbeobachtung und Selbstempfindung („dachte 
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ich mir“, „merkte ich, dass ich“) und der Ungeduld, hin zu Verzweiflung und 
Kontrollverlust („ich konnte einfach nicht mehr“, „ich fing an zu weinen“) und 
den Topos der Geschwindigkeit („dann ging alles ganz schnell“). Gegen Ende 
der Erzählungen folgen dann z.B. die narrativen Topoi Geburtszeitpunkt („um 
CARD Uhr das Licht“), der Überraschung („ich konnte es kaum glauben“), des 
ersten Körperkontakts („erst Mal an die Brust“, „endlich in den Arm nehmen“), 
der Nabelschnur („Mein Mann hat dann die Nabelschnur“). Weitere narrative 
Topoi gegen Ende sind Unbeschreibbarkeit („war ein unbeschreibliches Gefühl“), 
Qualität („es war der schönste Moment“), Glück und dann vor allem der erzäh- 
lerischen Bewertung als Mischung von Retrospektive, Zusammenfassung, Rück- 
bindung an die Gegenwart („So das war mein Bericht“, „so lang geworden“) und 
Dankbarkeit / Stolz („bin unendlich dankbar, dass“, „stolz auf mich, dass ich“). 


7.4.2 Hypothesengeleitetes Vorgehen 


Die Daten können auch vor der Folie einer Erzähltheorie interpretiert werden. 
Orientiert man sich beispielsweise an der Theorie von Labov und Waletzky (1973), 
bilden die dort genannten Erzählfunktionen (Orientierung, Komplikation, Evalu- 
ation, Resolution und Coda), nach denen sich Erzählungen unterteilen lassen, 
ein für die vorliegenden Zwecke geeignetes Analyseraster (Labov/Waletzky 1973, 
112, 116, 122; Bubenhofer 2018b). Zwar sind diese Kategorien nicht zwingend auch 
als erzählzeitliche temporale Abfolge deutbar, aber für die diagrammatische 
Berücksichtigung der Sequenzialität in den Geburtsberichten sind die Kategorien 
sehr gut nutzbar. Die im vorherigen Abschnitt genannten narrativen Topoi lassen 
sich meist unstrittig diesen Kategorien zuordnen. 

Als Ergebnis der beiden Perspektiven ist es nun möglich, ein integrierendes 
Diagramm zu zeichnen, das Daten und Theorie in Einklang zu bringen sucht. In 
Abbildung 100 ist dieses Diagramm abgebildet. Die Grundstruktur des Diagramms 
ist durch die strukturierenden Kategorien Orientierung, Komplikation, Evalua- 
tion, Resolution und Coda von Labov und Waletzky geprägt (farblich codierte 
Rhomben). Die datengeleitet gefundenen narrativen Topoi sind als kleine Kästen 
aufgeführt und tragen den Erzählkategorien zugeordnete Farbcodes. Daran wird 
zudem ersichtlich, dass es Topoi gibt, die nicht eindeutig zugeordnet werden 
können, womit auch die sequenzielle Ordnung durchbrochen wird. 

Weiter sind im Diagramm Ergebnisse der Dichteverteilung der Wortartklas- 
sen, Personalformen und semantischer Klassen eingetragen, auf die ich hier 
nicht eingegangen bin. 
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Abb. 100: Integrierendes Modell der narrativen Muster in den Geburtsberichten (vgl. Bubenho- 
fer 2018b) 


Als abstrakteste Kategorien finden sich zudem die datengeleitet gewonnenen 
Toposklassen (graue Spalten), nach denen das Gesamtnarrativ strukturiert zu 
sein scheint: Erwartung, Selbstbestimmung, Fremdbestimmung, Egozentrie- 
rung, Euphorisierung und Initiation. Diese Toposklassen sind Gruppen von nar- 
rativen Topoi mit ähnlichen Funktionen. Ohne auf diese nun genauer eingehen 
zu können, skizziere ich die Klassen ganz kurz (siehe dazu Bubenhofer 2018b von 
wo die folgenden Erklärungen auch zitiert sind): 

— Erwartung: Meist am Anfang der Geschichten stehende Phase mit Orientie- 
rungsfunktion, in der neben der Ansprache der Leserinnen, der Motivierung 
und Situierung der Erzählung meist die Unsicherheit, aber auch Ungeduld 
gegenüber der erwarteten Geburt ausgedrückt wird. 

- Selbstbestimmung: Manchmal mit der ersten Toposklasse vermischt, manch- 
mal stärker abgehoben, ist diese Toposklasse durch vielfältige Schilderun- 
gen der Selbstbeobachtung und der eigenen Empfindungen gekennzeichnet, 
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wobei es sich inhaltlich vornehmlich um die Wehentätigkeit, das Platzen 
der Fruchtwasserblase etc. handelt. Die Beobachtungen und Empfindungen 
läuten dann normalerweise die Erzählung der Komplikationen ein, um die 
eigentliche Erzählung der Geburt zu starten. 

Fremdbestimmung: Mit Eintritt ins Krankenhaus und der Aufnahme als 
gebärbereite Frau beginnt eine Phase der Fremdbestimmung, die auch oft so 
erzählt wird. Personalformen der 1. Person Plural gehen stark zurück, die 3. 
Person bleibt stabil. Wichtige narrative Topoi sind „Dauer“ und „Positions- 
wechsel“. Das Erzählen von Positionswechseln und natürlich auch der wie- 
derkehrenden Untersuchungen, insbesondere der Öffnung des Muttermun- 
des, dienen dazu, das (normalerweise) lange Warten in der Eröffnungsphase 
zu schildern. Die damit einhergehende erhöhte Wehentätigkeit führt dabei 
zu einer Zunahme der Benutzung von Schmerz- und Ärgerausdrücken. 
Egozentrierung: Wenn in den Erzählungen die Austreibungsphase geschil- 
dert wird, nimmt das Schmerzvokabular nochmals zu. Zudem sind die beiden 
narrativen Topoi „Gefühlsvergleiche und Grenzerfahrungen“ sowie „Ver- 
zweiflung und Kontrollverlust“ typisch, mit denen die Unbeschreiblichkeit 
des körperlichen Erlebens narrativ bewältigt wird. Jetzt treten bei den Verben 
die Personalformen der 1. Person Plural stark zurück (dafür ist eine leichte 
Zunahme der Ich-Formen zu beobachten). Parallel dazu treten weitere anwe- 
sende Personen in den Schilderungen weitgehend zurück. Narrativ findet 
eine Art der Evaluation statt, mit der der erzählte Geburtsvorgang sozusagen 
angehalten wird, um die Unbeschreiblichkeit des Schmerzes zu beschreiben: 
insofern im Erleben dieses Moments jegliches Kontrollgefühl verloren geht, 
ist dies auch in der Erzählung der Moment, innezuhalten und dafür den Sinn 
des Erzählens - gleichermaßen als Zäsur — zu thematisieren. 
Euphorisierung: Es gibt verschiedene narrative Topoi, die dazu dienen, die 
Resolution einzuleiten und die Erzählung fortzusetzen, so z.B. das Themati- 
sieren der Presswehen (die sich von den vorhergehenden Wehen unterschei- 
den und von vielen Frauen offensichtlich als „angenehmer“ empfunden 
werden, da sie das Zeichen für die Austreibung sind. Als euphorisierend wird 
auch das Befühlen des austretenden Kopfes des Kindes erzählt. Der narra- 
tive Topos der Geschwindigkeit („jetzt ging alles ganz schnell“) gehört eben- 
falls zu den erzählerischen Mitteln, die Resolution herbeizuführen. In dieser 
Toposklasse nehmen dann die emotionalen Ausdrücke der Freude, des Ver- 
trauens und der Erwartung wieder deutlich zu, wie auch die 1. Person Plural 
bei den Verben. Viele narrative Topoi in diesem Bereich haben ebenfalls eva- 
luative Funktion. Medizinische Komplikationen wie Blutverlust, Dammrisse 
etc. haben natürlich wiederum auch erzählerisch Komplikationsfunktion. 
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— Initiation: Hierzu können narrative Topoi gezählt werden, die bereits erzähle- 
rische Coda-Funktion aufweisen, also die das Erleben zusammenfassen und 
bewerten, die Rückbindung an die Jetztzeit leisten und die Abschlussformeln 
enthalten, in denen beispielsweise Wünsche an die Leserinnen gerichtet 
werden. Ich möchte diese Klasse „Initiation“ nennen, da damit (vor allem bei 
Erstgeburten) die Aufnahme in den Kreis der Frauen mit (weiterer) Gebärer- 
fahrung erfolgt ist. Dafür sprechen auch die narrativen Topoi des „Stolzes“ 
und der „Dankbarkeit“, die aber je nach Kontext sowohl Evaluations- als 
auch Coda-Funktion haben. 


7.5 Fazit 


Zum Schluss der Darstellung dieser Studie sollen die diagrammatischen Operati- 
onen wiederum verortet werden. 


7.5.1 Diagrammatische Verortung 


Erklärtes Ziel der Studie war, die bei korpuslinguistischen Analysen oftmals 
nötige Desequenzialisierung der Daten zu verhindern. Allerdings lag das Inte- 
resse nicht darin, bei der Analyse von Einzeltexten zu bleiben, sondern eine 
quantitative Sicht einzunehmen und die Musterhaftigkeit von Sequenzen zu 
untersuchen. Am Anfang der Analysen steht deshalb trotzdem die diagramma- 
tische Grundfigur der Liste mit ihrer rekontextualisierenden Wirkung, die aller- 
dings nicht Einzellexeme, sondern Wort-n-Gramme, bzw. komplexe n-Gramme, 
aufführt. Gleichzeitig werden mit dem Ansatz der positional verorteten Daten die 
berechneten n-Gramme bezüglich ihrer typischen Positionen in den Geschichten 
charakterisiert, so dass die n-Gramme in einem Streudiagramm (diagrammati- 
sche Grundfigur: Vektor) dargestellt werden können. Beim Kollokationsansatz 
wird Sequenzialität der n-Gramme so modelliert, dass ihre typische syntagmati- 
sche Verkettung berechnet wird. Dafür wird die statistische Assoziation zwischen 
den n-Grammen hinzugezogen, um typische n-Gramm-Kollokationen bestimmen 
zu können. Die Daten werden damit nach der diagrammatischen Grundfigur 
Graph modelliert. 

Sequenzialität wird also auf zwei Ebenen erhalten, einerseits auf der syn- 
tagmatischen Ebene der Wort-n-Gramme, andererseits durch die durchschnitt- 
liche Position in den Geschichten bzw. durch das Kollokationsverhalten der 
n-Gramme. Dadurch kommt es zu einer Dimensionsanreicherung der Daten, da 
jedes n-Gramm bezüglich seiner Gebräuchlichkeit und seiner typischen Position 
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in den Geschichten charakterisiert werden kann. Diese Positionen werden dann 
vor einem erzähltheoretischen Hintergrund gedeutet und als Indizien für Erzähl- 
funktionen gelesen. 

Wie auch schon bei den Geokollokationen, findet die programmiertech- 
nische Implementierung in einer Coding Culture statt, die durch Open Source, 
White Box, weitgehender Entprofessionalisierung und Selbstermächtigung 
geprägt ist. Allerdings scheint mir im Fall von narrativ aufzufassenden Daten der 
Experimentierraum für diagrammatische Formen noch keineswegs ausgefüllt zu 
sein. Die Frage ist nämlich, wie Sequenzialität visualisiert werden soll. Die von 
uns gewählten Formen modellieren Sequenz trivial als x-Achse in Achsendia- 
grammen, auch in Kombination mit einer Graphdarstellung im Fall des Kolloka- 
tionsansatzes. Damit bewegt man sich im Kanon wissenschaftlicher Visualisie- 
rungspraktiken. Es ist aber zu vermuten, dass andere Visualisierungspraktiken 
produktiv gemacht werden könnten, die aus Feldern entstammen, bei denen 
Sequenzialität oder sogar Narrativität eine bedeutende Rolle spielt. Das könnte 
beispielsweise beim Gamedesign der Fall sein: Dort geht es um die Frage, wie 
interaktive Narration visuell dargestellt werden kann. 


75.2 Ausblick 


Ergebnis der datengeleiteten Analysen der Geburtsberichte war ein integrieren- 
des Modell, dass die narrative Struktur wiedergeben soll (vgl. Abbildung 100). 
Diagrammatisch wird deutlich, dass dieses integrierende Diagramm der Grund- 
struktur der explorativen Visualisierungen folgt, also der Diagramme, die zur 
Analyse der Daten nötig waren und Sequenzialität auf einer x-Achse abbilden. Es 
wäre möglich, die Erkenntnisse in eine andere diagrammatische Grundfigur zu 
transformieren und beispielsweise die gerichtete Graphdarstellung von NarrViz 
für das interpretierende Diagramm als hierarchisches Baumdiagramm umzudeu- 
ten und damit die narrativen Topoi nach unterschiedlichen Erzählfunktionen zu 
gliedern und dabei Sequenzialität als Ordnungskriterium zu ignorieren. Die oben 
gewählte Darstellung weist aber auch diagrammatisch eine Ähnlichkeit mit der 
Sequenzialität in Geschichten auf, verzichtet also auf eine grundlegende Trans- 
formation weg von dieser Sequenzialität. 

Im Gegensatz zu den Geokollokationen (vgl. Kapitel 6) fanden die Studien 
zu den Geburtsberichten in einem kleineren Zeitraum statt. Es gab deswegen 
weniger Bearbeitungsiterationen bei der Erstellung der visuellen Analysewerk- 
zeuge und nur beim NarrViz-Tool, das von Katrin Affolter implementiert wurde, 
waren wir ein Team von drei Personen (neben Katrin Affolter und mir noch Klaus 
Rothenhäusler) in die Diskussionen involviert. Im Gegensatz zu der Geokolloka- 
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tionenanwendung, deren Code aus mehreren Händen stammt, war bei NarrViz 
alleine Katrin Affolter fiir die Programmierung zustandig. Daher ist der Code viel 
stärker als bei den Geokollokationen von einem durchgehenden Programmier- 
konzept durchdrungen. 

Nachteil dieser Lösung ist eine stärkere Separierung zwischen Implementie- 
rung und Analyse: Zwar stammt die Konzeption von NarrViz aus gemeinsamer 
Diskussion, die Programmiererin war jedoch viel weniger in die Arbeits- und 
Sichtweise des Analysten eingeweiht. Dies war dann auch der Grund, dass ich 
neben der Benutzung von NarrViz auch eigene Visualisierungen implementierte, 
die im Fall der dreidimensionalen Darstellung die Integration einer dritten Pers- 
pektive auf die Daten ermöglicht (vgl. Abschnitt 7.3.1). 

Eine interessante Umdeutung der Studie zu den Geburtsberichten ergab sich 
nach Abschluss der Analysen durch die Zusammenarbeit mit Nadine Prigann, 
einer Studentin des Faches Interaktionsdesign an der Zürcher Hochschule der 
Künste (ZHdK). Ihre Abschlussarbeit „Explorative Spatial Analysis“ (Prigann 
2018) besteht in einer Installation, bestehend aus zahlreichen an Nylonfäden 
hängenden Acrylglas-Platten, die im Raum in Form eines dreidimensionalen 
Streudiagramms angeordnet sind. Die Installation orientiert sich dabei an der 
dreidimensionalen Darstellung der n-Gramm-Positionen unserer Studie (vgl. 
Abbildung 90) und benutzt auch die selben Daten. 


Abb. 101: Installation „Explorative Spatial Analysis“ auf Basis der Geburtsbericht-Analysen von 
Nadine Prigann (2018). Vgl. http: //nadineprigann.de/explorativespatialanalysis.html/ (letzter 
Zugriff: 22. 9. 2020) 
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Priganns Arbeit transformiert die n-Gramme ausgehend vom Streudiagramm 
in eine räumliche, physisch erlebbare Form. Die x-Achse mit der Position der 
n-Gramme in den Geschichten liegt in Längsrichtung des Raums, die Clusterähn- 
lichkeit (y-Achse) in der Querrichtung und in der Vertikalen wird die Frequenz 
(z-Achse) angezeigt. Gleichzeitig beleuchten Scheinwerfer die Acrylglasplat- 
ten und diese werfen eine Farbreflexion auf den Boden. Diese Farbreflexionen, 
eine auch aus Diagrammen in der Fläche bekannte Projektion von drei auf zwei 
Achsen, überlagern sich dort und zeigen in der Schnittmenge eine höhere Farbin- 
tension, wo auch die Acrylglasplatten übereinander hängen und also eine Cluste- 
rung von n-Grammen am gleichen Ort repräsentieren. 

Als weiteres Element sind an Stellen, die Prigann als Cluster interpretiert, 
Lautsprecher aufgehängt, über die eine Computerstimme die sich dort befind- 
lichen n-Gramme vorliest. Dabei kommt es zu einem Stilbruch zwischen der 
maschinellen Stimme und den emotionalen Inhalten, die durch die n-Gramme 
angedeutet, aber als Ergebnis einer maschinellen Analyse nur fragmentarisch 
wiedergegeben werden. Die Installation ist insofern interaktiv, als dass sie began- 
gen werden kann, wobei sich je nach Standort andere visuelle und auditive Per- 
spektiven ergeben. 

Vor dem Hintergrund einer Visuellen Linguistik ist die Arbeit nicht nur auf- 
grund ihrer Form der Visualisierung von Interesse, sondern auch aus Sicht der 
Visualisierungspraxis: Prigann, einer anderen Disziplin angehörig, interpretiert 
die Daten unserer linguistischen Analyse neu und überführt sie in die diagram- 
matische Praxis des Interaktionsdesigns, das andere Denkstile pflegt, die sich in 
anderen Praktiken zeigen. So ist die Installation als Form der Präsentation dort 
ein wichtiger Bestandteil dieser Praxis, die in der Linguistik wiederum marginal 
und höchstens im Rahmen von öffentlichen Publikumsanlässen o.ä. Verwen- 
dung findet. 

Diese anekdotischen Anmerkungen zeigen, dass eine enge Zusammenarbeit 
zwischen Konzipierung, Implementierung und Analysepraxis bei visuellen Ana- 
lysetools nötig ist, was auch bei anderen Projekten immer wieder angemahnt wird 
(Keim et al. 2010, 150ff.; Kath et al. 2015). Allerdings sind Differenzen zwischen 
den unterschiedlichen Forschungslogiken und Denkstilen, gerade bei der Kom- 
bination von geistes-/sozialwissenschaftlichen und informatischen Disziplinen, 
nicht zu unterschätzen, können aber auch gezielt produktiv gemacht werden, wie 
das Beispiel der Installation von Prigann zeigt. 


8 Sprachgebrauch und Interaktion 


Die dritte Fallstudie zu Visualisierungen sprachlicher Daten ist von etwas 
anderem Charakter als die beiden anderen Studien. Es geht dabei um eine kriti- 
sche Reflexion zur zentralen diagrammatischen Form der interaktionalen Lingu- 
istik bzw. der Gesprachslinguistik, dem Transkript. Ich habe an mehreren Stellen 
bereits auf die Bedeutung der Transkriptionstechnik fiir die Analyse gespro- 
chener Sprache hingewiesen (vgl. Abschnitte 3.1 und 5.3). Die diagrammatische 
Grundfigur der Partitur ist dabei ein entscheidender Gedanke, um die Simultane- 
ität von Stimmen sichtbar und damit analysierbar zu machen. Auch wenn nicht 
alle Transkriptionsstandards explizit von Partiturschreibweise o.ä. sprechen, 
finden sich doch immer Auszeichnungsmethoden, um zumindest bei Überlap- 
pungen Simultaneität von Gesprächsbeiträgen darzustellen. 

Ich möchte in den folgenden Abschnitten nun die Frage diskutieren, ob 
Gesprächstranskripte überhaupt (noch) die richtige Form sind, gesprochene 
Sprache analysierbar zu machen, insbesondere vor dem Hintergrund neuerer 
theoretischer Überlegungen in der interaktionalen Linguistik und der Gesprächs- 
linguistik. Zudem stellt sich die Frage, wie gesprächsanalytische Fragestellungen 
durch eine korpuslinguistische Perspektive inspiriert werden könnte und welche 
Konsequenzen dies auf die diagrammatische Darstellung zeitigt. 

Ich stelle dafür zunächst wichtige Grundüberlegungen zu theoretischen Prä- 
missen der interaktionalen Linguistik bzw. der Gesprächslinguistik an, um dann 
darauf basierend neue Visualisierungsformen vorzuschlagen. 


8.1 Grundüberlegungen zur Analyse von Gesprächen 


Mit einer Transkription von gesprochener Sprache, die Simultaneität sowie 
verbale, paraverbale und nonverbale Signale sorgfältig verschriftlicht und somit 
entzeitlicht, ist eine wichtige Grundlage für die Analyse geschaffen. Eine Grund- 
lage, mit der es möglich wird, gesprochene Sprache nicht zu den Bedingungen 
und damit mit dem Maßstab geschriebener Sprache zu analysieren, sondern als 
eigene Modalität. Die Transkription ist damit auch eine Grundlage, um Sprach- 
handeln aus ethnomethodologischer, pragmatischer Sicht zu untersuchen. Diese 
Perspektive ist dabei davon geprägt, Alltagshandeln im Detail, empirisch genau 
zu beobachten und 


als selbstverständlich hingenommene Praktiken und Verfahren [...] zu bestimmen, mittels 
derer die Mitglieder einer Gesellschaft [...] in ihrem Handeln das eigene Tun wahrnehmbar 


8 Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https://doi.org/10.1515/9783110698732-008 
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und erkennbar machen und die Wirklichkeit um sich sinnhaft strukturieren und ordnen. 
(Bergmann 2010, 51) 


Vor diesem Hintergrund ist klar, dass eine möglichst detaillierte Transkription 
und eine detaillierte Analyse von kurzen Sequenzen zentral ist, um damit zu 
einem umfassenderen Verständnis zu gelangen, wie diese zu einer abstrakteren 
Makroperspektive führen, also gemeinschaftliches Handeln und gemeinschaftli- 
che Organisation modellieren. 

Als Korpuslinguistin oder Korpuslinguist ist man manchmal ob dieser Pers- 
pektive verwundert: Die Ziele sind ähnlich, vor allem bei einer sozial- und kultur- 
wissenschaftlich interessierten Korpuslinguistik (Bubenhofer 2009; Felder et al. 
2011; Scharloth/Bubenhofer 2011), die Methodologie unterscheidet sich jedoch 
deutlich, da die Indizien für kommunikatives und gemeinschaftlich sinnstiften- 
des Handeln eher in musterhaftem Sprachgebrauch im weitesten Sinne gesehen 
werden, also in einem Phänomen, das bei einer Analyse aus quantitativer Sicht 
zutage tritt, wie die beiden Studien zu den Geokollokationen (Kapitel 6) und Nar- 
rativen (Kapitel 7) zeigten. Allerdings muss auch gesagt werden, dass die Kor- 
puslinguistik generell, auch die oben erwähnte Richtung, relativ blind gegenüber 
gesprochener Sprache ist, was zu Teilen damit erklärt werden kann, dass erst 
jüngst genügend große Mengen gesprochener Sprache als Korpora aufbereitet zur 
Verfügung stehen.” Doch davon abgesehen verwundern die methodologischen 
Differenzen doch. Darauf werde ich später noch zu sprechen kommen. 

Der Pragmatikbegriff ist für die Gesprächslinguistik? und die Korpuspragma- 
tik, also die sozial- und kulturlinguistisch interessierte Korpuslinguistik zentral. 
Arnulf Deppermann, der wichtige interaktionslinguistische Studien durchführte, 
stellt in „Pragmatik revisited“ aber fest, dass die empirische Forschung eine Neu- 
akzentuierung des Begriffs nahelegt: 


Ich plädiere dafür, vier Bestimmungsstücke ins Zentrum der Auffassung von „Pragmatik“ 
zu rücken, die traditionell nicht als zentrale Aspekte von „Pragmatik“ gesehen wurden: 
Leiblichkeit, Zeitlichkeit, Sozialität und Epistemizität. Zusammengenommen führen sie zu 
einem Verständnis von Pragmatik als der Wissenschaft vom sprachlich-leiblichen Handeln 
von soziohistorischen Subjekten in Raum und Zeit. (Deppermann 2015, 327) 


95 Dazu zählt insbesondere die Datenbank für Gesprochenes Deutsch (DGD) am Institut für 
Deutsche Sprache (Mannheim), https://dgd.ids-mannheim.de/ (letzter Zugriff: 22. 9.2020), vgl. 
Schmidt (2014). 

96 Wenn ich von „Gesprächslinguistik“ ohne weiteren Präzisierungen rede, meine ich damit Ge- 
sprächslinguistik / Konversationsanalyse und interaktionale Linguistik insgesamt. 
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Deppermann plausibilisiert alle vier Aspekte mit gesprächsanalytischen Beispie- 
len. Für meine weitere Argumentation sind insbesondere Zeitlichkeit und Sozia- 
lität entscheidend, da ich bei diesen Potenzial für weiterführende diagrammati- 
sche Überlegungen sehe, doch ich möchte alle vier kurz skizzieren. 

Unter „Leiblichkeit“ versteht Deppermann die intrinsische Verwobenheit von 
Sprache mit „Sichtbarem und Tastbarem, mit Objekten und Räumen, mit Positio- 
nen und Bewegungen, mit Aufmerksamkeit und Wahrnehmung“, die „Pragmatik 
muss deshalb Abschied nehmen vom Modell ‚Sprecher-Hörer‘ als kommunikati- 
ver Grundkonstellation“ (Deppermann 2015, 330). Dies bedeutet, dass sprachli- 
ches Handeln als multimodale Koordination im Raum-Zeit-Kontinuum aufgefasst 
und analysiert werden muss. 

Es ist augenscheinlich, dass ein Gesprächstranskript nicht in der Lage ist, 
Daten gesprochener Sprache so zu visualisieren, dass die Komplexität der kom- 
munikativen Situation so umfassend analysierbar ist. Naheliegend ist es, neben 
dem Gesprächstranskript weitere Visualisierungen wie Videoaufnahme, Situ- 
ationsskizzen und dergleichen einzusetzen (vgl. dazu Norris 2004), aber auch 
zusätzlich andere Datentypen zu erheben, wie etwa Blickrichtungen über Eye 
Tracking. Solche verschiedenartige Datentypen diagrammatisch zu integrieren 
ist eine besondere Herausforderung, da verschiedene diagrammatische Grundty- 
pen und Organisationsprinzipien zusammengeführt werden müssen, insbeson- 
dere Sequenzialität, dreidimensionaler Raum und Pfade im Raum. 

„Zeitlichkeit“ ist ein weiterer bedeutender Aspekt interaktionaler Kommuni- 
kation: 


Es geht [der Pragmatik, NB] zum einen darum, grundlegende Mechanismen der zeitlichen 
Strukturierung des Handelns zu erfassen, zum anderen pragmatische Phänomene selbst in 
ihrer zeitlichen Struktur zu rekonstruieren (Deppermann 2015, 331). 


Dabei geht es nicht bloß um Sequenzialität auf Mikroebene (turn-Abfolgen), 
sondern um weitergehende Bezüge auf Vergangenheit, Gegenwart und Zukunft 
im Verlaufe einer Interaktion, die Beiträge zur Handlungsbedeutung eines turns 
liefern (Deppermann 2015, 333). 

Auch eine Zeitlichkeit mit solchen weitergehenden Bezügen wird in einem 
Gesprächstranskript nur ungenügend repräsentiert. Seine (gewollte) sequenzielle 
und polyphone Ausrichtung als (angestrebte) 1:1-Repräsentation des Gesprächs- 
flusses ist hier hinderlich, da Bezüge in die Vergangenheit und die Zukunft auch 
an diese Linearität gebunden sind. 

Der dritte Aspekt, „Sozialität“, umfasst wiederum zwei Komponenten. Einer- 
seits geht es um die soziale Konstitution von Handlungsbedeutungen (Depper- 
mann 2015, 335ff.). Diese müssen als Prozessphänomen aufgefasst werden, in 
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dessen Verlauf durch gegenseitige Verstehensdokumentation gemeinschaftlich 
eine Handlungsbedeutung erarbeitet wird, etwa durch Nachfragen, Paraphra- 
sieren und wiederum den Reaktionen darauf. Wenn die soziale Konstitution 
des Handels vernachlässigt wird, werden wichtige Dimensionen pragmatischer 
Bedeutung ausgeblendet (Deppermann 2015, 337): So etwa in kommunikativen 
Gattungen sedimentierte sozialtypisch geregelte Interaktionszusammenhänge 
und Erwartungsstrukturen oder die sozialsymbolische Kraft des Handelns, mit 
der sowohl Situationen (z.B. eine Vorlesung) als auch das dafür nötige Personal 
konstituiert wird. 

Die zweite Komponente von „Sozialität“ fokussiert die Beteiligungsstruktu- 
ren, insbesondere in Mehrpersonenkonstellationen, wo „die Beteiligten vor Auf- 
gaben der pragmatischen Organisation [stehen], die im Sprecher-Hörer-Modell 
nicht zu beschreiben sind“ (Deppermann 2015, 338). So gibt es in solchen Kons- 
tellationen verschiedene Rollen, wie „side participants (unadressierter Teilneh- 
mer), overhearer (nicht beteiligter Zuhörer), eavesdropper (Lauscher), indirect 
target (nicht-adressierter Teilnehmer, für den eine Botschaft nicht bestimmt ist) 
usw.“ (Deppermann 2015, 338). Oder es spielen funktionsrollenbezogenes Wissen 
und Routinewissen über Handlungsabläufe als soziale Handlungserwartungen 
und Wissensvoraussetzungen eine tragende Rolle, um die entstehende Hand- 
lungsbedeutung rekonstruieren zu können. 

Wenn „Sozialität“ bei einer Gesprächsanalyse gebührend beachtet werden 
soll, stößt auch hier das traditionelle Gesprächstranskript an Grenzen, da bei- 
spielsweise nur schon die Rollen der Teilnehmenden bezüglich ihrer Beteili- 
gungsart in einer Mehrpersonenkonstellation in traditionellen Gesprächsvisuali- 
sierungen nicht einfach so auf einen Blick ersichtlich sind, da der Überblick (z. B. 
alleine zur Anzahl der turns) fehlt. 

Schließlich gilt es, „Epistemizität“ in sozialen Interaktionen zu berücksich- 
tigen. Damit sind die Wissensbestände (common ground) selbst gemeint, die zur 
Gestaltung sprachlichen Handelns nötig sind. Dabei muss aber die Prozesshaftig- 
keit der Genese von common ground beachtet werden, da im Verlauf einer Inter- 
aktion solcher common ground erarbeitet wird und Auswirkungen auf die Inter- 
aktionen hat. Während zu Beginn einer Interaktionsgeschichte beispielsweise 
noch ein großer verbaler Aufwand nötig ist, Handlungsbedeutung zu erstellen, 
reichen zu einem späteren Zeitpunkt Stichwörter oder Gesten, um Gleiches zu 
erreichen (vgl. Deppermann 2015, 344 für ein illustratives Beispiel einer Fahr- 
stunde und dem Üben des Einparkens). 

Ein Gesprächstranskript gibt in jedem Moment das wieder, was verbal — und 
je nach Transkriptionstiefe auch para- oder nonverbal — geäußert wird. Die Sedi- 
mente der Interaktionsgeschichte sind nicht sichtbar und müssen rekonstruiert 
werden. Denkbar ware jedoch, diagrammatische Mittel zu finden, die wenigstens 
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die Spuren des Vergangenen erhalten, damit die Rekonstruktion der Interaktions- 
geschichte leichter wird. 

Es steht außer Frage, dass viele gesprächsanalytische Studien mit einer Prag- 
matiktheorie, wie sie Deppermann skizziert, arbeiten. Die theoretischen Verän- 
derungen der Gesprächslinguistik führten auch zu methodischen Veränderungen 
der Transkription, wenn man an die Integration von Audio- und Videodaten, die 
exakte Alignierung mit der Transkription etc. denkt. Mir scheint aber, dass die 
Integration solcher Aspekte weiterhin der diagrammatischen Grundfigur der Par- 
titur folgt und daher die Grundprobleme nicht löst, nämlich in der Sequenziali- 
tät gewissermaßen gefangen zu sein. Um die Entwicklungen der Theorie auch 
transkriptionsmethodisch zu reflektieren, ist eine grundsätzliche Hinterfragung 
der diagrammatischen Grundfigur nötig, ohne natürlich die Vorteile zu verlieren. 
Dass das Gesprächstranskript in der Form des Partiturprinzips eine Innovation 
war, da es Simultaneität und Sequenzialität gesprochener Sprache erstmals ana- 
lysierbar machte, ist unumstritten. Im nächsten Abschnitt möchte ich aber Vor- 
schläge machen, wie diese Darstellungsform durch alternative Visualisierungen 
ergänzt werden könnte. 


8.2 Vorschläge für Visualisierungsformen 


Es ist unmöglich, mit einer Visualisierung gesprochener Sprache die im vorheri- 
gen Abschnitt elementaren Aspekte von Leiblichkeit, Zeitlichkeit, Sozialität und 
Epistemizität gleichermaßen zu berücksichtigen - bzw. die Daten so zu visuali- 
sieren, dass sie hinsichtlich der oben beschriebenen Aspekte lesbar werden. Ziel 
der (zeichnerischen) Skizzen und Überlegungen in diesem Abschnitt ist es, dia- 
grammatische Formen vorzuschlagen, auf denen komplexere Visualisierungen 
und Analysemethoden aufgebaut werden könnten. 

Eine Grundüberlegung dabei ist, dass eine Vereinigung eher quantitativ- 
serieller und qualitativ-ethnomethodologischer Analysemethoden wichtig ist, 
um den interaktionstheoretischen Überlegungen gerecht zu werden. Daher stelle 
ich zunächst Diagramme vor, welche diesen Brückenschlag versuchen, dabei 
aber auf dem klassischen Gesprächstranskript beruhen. Danach schlage ich ein 
Diagrammtypus der „Jahresringe“ vor, um eine neue Art von Transkription zu 
ermöglichen. 
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8.2.1 Korpuslinguistik und Gesprächsanalyse 


Mit Fokus auf die Sozialität von Gesprächen ist auffallend, dass es unterschiedli- 
che Beteiligungsstrukturen gibt, die unterschiedliche Rollen in einer Interaktion 
widerspiegeln (vgl. Abschnitt 8.1). Beim klassischen Gesprächstranskript, ins- 
besondere wenn es konsequent in Partiturschreibweise verfasst ist, sind solche 
Rollen prinzipiell sichtbar. Vereinfacht zu einer grafischen Form sind beispiels- 
weise Typen denkbar, wie in Abbildung 102 aufgeführt. Unverkennbar steht dabei 
die diagrammatische Grundfigur der Partitur Pate, die Verschriftlichung der turns 
wird jedoch zu Gunsten einer grafischen Abbreviatur ersetzt. Der Gewinn der gra- 
fischen Abbreviatur liegt darin, die strukturellen Besonderheiten zu betonen und 
die Gesprächsinhalte in den Hintergrund zu stellen. 


=——o 


— Abb. 102: Beteiligungsstrukturen grafisch 
we visualisiert 
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Wenn klassische Transkripte vorhanden sind, kann die grafische Umsetzung 
automatisiert aufgrund der turn-Struktur (wie sie beispielsweise bei in XML 
codierten Transkripten verfügbar sind) erstellt werden. Es handelt sich also um 
eine Sicht, bei der man aus weiterer Entfernung auf das Transkript schaut. So 
werden Strukturen sichtbar, wie Typen von Sprecherwechsel oder deren Häufig- 
keit und Dynamik, die als unterschiedliche „Beteiligungsstrukturen“ (Depper- 
mann 2015, 338) aufgefasst werden können. 

Während bei einem einzelnen Gesprächstranskript diese Sicht noch zu par- 
tikular ist, können bei einer größeren Datensammlung von Gesprächstranskrip- 
ten wiederkehrende Strukturtypen gefunden werden, indem (automatisiert) 
ähnliche grafische Strukturen entdeckt werden. Damit kommt eine quantitative 
Sichtweise ins Spiel, mit der Einzelbeobachtungen in ihrer Serialität gewürdigt 
werden können. 


re m — 


Abb. 103: Kombination von Typen und statistischen Angaben (Boxplot) 


Wenn Sequenzen in den Transkriptdaten nach Beteiligungsstrukturen typologi- 
siert werden können, ist es naheliegend, diese Typen mit bestimmten weiteren 
Eigenschaften korrelieren zu lassen. So könnte man sich bei einem bestimmten 
Typus von turn-taking dafür interessieren, welches lexikalische Material dort 
- und wo genau dort — typischerweise auftritt. Solche quantitativ erfassbaren 
Merkmale können dann statistisch ausgewertet und in einem kombinierten Dia- 
gramm dargestellt werden, das beispielsweise eine Boxplot- mit der Partiturdar- 
stellung kombiniert (vgl. Abbildung 103). Der Boxplot zeigt dabei beispielsweise 
an, wo genau — wie viele Wörter vor oder nach dem Sprecherwechsel und bei 
welcher Stimme - Wortwiederholungen bei solchen Sprecherwechseln auftreten. 

Nach dem gleichen Prinzip können Gesprächsdynamik-Typen grafisch 
abgekürzt werden. Abbildung 104 zeigt eine entsprechende Skizze: oben ist das 
Prinzip dargestellt, mit dem die einzelnen turns Knoten eines Graphen darstel- 
len, so dass sich eine sequenziell ausgerichtete Graphdarstellung ergibt. Dieser 
Graph kann wiederum (automatisch) vereinfacht werden, so dass durch die Zick- 
zack-Bewegung mit der Höhe der Zacken sowohl die Anzahl beteiligter Sprecher/ 
innen, als auch mit der Amplitude (der Distanz zwischen den Wendepunkten) die 
turn-Längen ausgedrückt werden können. 
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Abb. 104: Grafische Abbreviaturen von Gesprächsdynamik 


Schließlich können die verschiedenen Darstellungsarten in Kombination benutzt 
werden. Ein mögliches Szenario ist in Abbildung 105 (s.u., S. 288) dargestellt: 
Wenn ein Korpus von Transkripten beispielsweise nach bestimmten Typen von 
Beteiligungsstrukturen klassifiziert ist, wäre eine Abfrage nach bestimmten 
Typen möglich. Man erhält dabei eine KWiC-Liste von Gesprächsausschnitten, 
die entsprechend klassifiziert worden sind, wenn gewünscht mit bestimmten Ein- 
schränkungen, z. B. mit der Einschränkung, dass im Bereich bestimmte Lexeme 
(im Beispiel: aber) vorkommen muss. 

Eine alternative Darstellung der gleichen Sequenzen würde stärker die 
Gesprächsdynamik hervorheben, wie im zweiten Diagramm in Abbildung 105, 
das das Amplituden-Diagramm von Abbildung 104 wieder aufnimmt. Dieses 
Diagramm repräsentierte entweder eine einzelne Gesprächssequenz, oder aber 
auch viele weitere ähnliche Sequenzen in aggregierter Form. Als interaktives 
Diagramm umgesetzt, wäre es möglich, bestimmte Positionen innerhalb der 
typischen Sequenz auszuwählen und weitere Informationen dazu aufzurufen. So 
könnten beispielsweise die Transkriptausschnitte (oder Audio- und Videospuren) 
oder aber statistische Auswertungen, z. B. über die statistische Verteilung von ver- 
balem, paraverbalem oder nonverbalem Material, aufgerufen werden. Das dritte 
Diagramm in Abbildung 105 ist ein einfaches Balkendiagramm, das anzeigt, wie 
oft aber an der markierten Position des Gesprächsdynamik-Typs auftritt - und 
wie oft an anderen Positionen. 
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un ADS... 
.. AV... 
Kwic 
„aber... 
typische Form 
+ a 


statistische 


ober Verteilung 


Abb. 105: Verschiedene Diagramme in Kombination 


Die gemachten Vorschläge sind weder besonders innovativ noch ausgegoren, 
sondern illustrieren einen Denkansatz, mit dem eingeführte diagrammatische 
Grundfiguren in einer bestimmten Disziplin und in einem bestimmten Denk- 
kollektiv hinterfragt werden können, wenn man versucht, dort nicht übliche 
diagrammatische Grundfiguren einzuführen. Die oben vorgeschlagenen Ampli- 
tuden-Diagramme zur Visualisierung von Gesprächsdynamik benutzen die dia- 
grammatische Grundfigur des Vektors, die in der Gesprächsanalyse ansonsten 
keine Verbreitung findet, denn das klassische Gesprächstranskript geht auf die 
diagrammatische Grundfigur der Partitur zurück. Eine in der Gesprächsanalyse 
bislang nicht häufig verwendete diagrammatische Grundfigur kann so produktiv 
gemacht werden, indem sie an die Analyseinteressen und Daten der Gesprächs- 
analyse angepasst wird. 

Zusätzlich liegen mit der quantitativ-korpuslinguistischen Perspektive, die 
bei diesen Beispielen auf Gesprächsdaten eingenommen wird, wiederum andere 
diagrammatische Grundfiguren nahe (KWiC, Diagramme der deskriptiven Statis- 
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tik). Damit konfrontiert ergeben sich neue Formen wie die grafischen Abbreviatu- 
ren von Beteiligungsstrukturen oder Gesprächsdynamiken, die sowohl deutlich 
gesprächslinguistisch geprägt sind (Partitur, Sequenz), als auch korpuslinguis- 
tisch (aggregierende Darstellung), woraus sich eine neue methodisch-methodo- 
logische Perspektivierung ableiten lässt. 


8.2.2 Jahresringe 


Die Skizzen im vorherigen Abschnitt basierten wesentlich auf der diagramma- 
tischen Grundfigur der Partitur. Wenn die zeitliche Struktur einer Gesprächsin- 
teraktion besser berücksichtigt werden soll, dann muss die Linearität der Parti- 
tur aufgebrochen werden. Zudem soll der Aspekt der Sozialität von Gesprächen 
besser repräsentiert werden können, indem ein „Gesprächsraum“ diagramma- 
tisch dargestellt werden soll. 

Die Grundidee des folgenden Vorschlages liegt darin, die Jahresringe eines 
Baumes als Metapher für Gespräche zu verwenden, um eine neue diagrammati- 
sche Form zu entwickeln. Jahresringe spiegeln eine Wachstumsgeschichte wider, 
ähnlich wie im Verlauf einer Gesprächsinteraktion die Äußerungen und Interak- 
tionen eine Spur hinterlassen und eine gemeinsam konstruierte Handlungsbe- 
deutung begründen. 


Abb. 106: Jahresringe als Metapher für Gespräche (Foto: Arnoldius, https://commons. 
wikimedia.org/wiki/File:Tree_rings.jpg, letzter Zugriff: 22.9. 2020) 
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Ausgangspunkt der Überlegungen ist ein traditionelles Gesprächstranskript mit 
Audiosignal. Für die folgenden Beispiele verwendete ich drei Gespräche aus dem 
FOLK-Korpus (Schmidt 2016a).” Die Arbeitsoberfläche der Anwendung ist folgen- 
dermaßen organisiert: Auf der linken Seite findet das Transkript Platz. Daneben 
wird der Gesprächsraum als Kreis dargestellt, auf dessen Linie alle Teilnehmen- 
den des Gesprächs aufgeführt sind (vgl. Abbildung 107). Parallel zum Verlauf des 
Gesprächs werden nun die turns ebenfalls kreisförmig dargestellt: Zentrum des 
Kreises ist die Position der Sprecherin auf dem Gesprächsraum-Kreis. Die Größe 
des Kreises richtet sich nach der Länge des turns. Je kleiner der Radius, desto 
kürzer der turn. Die Farbe der Kreise codiert die Sprecherin oder den Sprecher. 
Mit jedem turn entsteht ein Kreis, in dessen Mitte der turn in Textform während 
der Abspieldauer des turns aufscheint. Gerade nach dem Auftreten des turn-Krei- 
ses erscheint er farblich gefüllt, die Füllung verschwindet jedoch nach ein paar 
Sekunden. Die Kontur des Kreises bleibt aber bestehen.”® 


%3 VB guck ich mir die sch |) die 
puppen noch ma 


œ% VB ‘h ich hab immer gedacht das 
wär auch_ne echte 


œ% VB aber der is 


© VB das_s ne puppe sliehst dju 
œn DZ [ja] 
o 


03 DZ ‘h die die man von vorne 
sehen konnte da konnt 
man_s meist auch erkennen 
aber 

oo 

0 VB also des war ja echt gut 
gemacht ne 

ou 


07 DZ “h ich (find_s'tand_s) schade 
dass nich en paar ältere auch 
mitges{pielt habe)n 

œs VB [jaja] 

œ VB ja] 

œ DZ [nje 


MAAN dmm nit 


Abb. 107: Anwendung Jahresringe, Transkript und Jahresringe-Darstellung 


97 Bei den Gesprächen handelt es sich um: FOLK_E_00080 - Alltagsgespräch: Pausenkom- 
munikation im Theater; FOLK_E_00012 - Alltagsgespräch: Spielinteraktion mit Kindern; 
FOLK_E_00120 - Institutionelle Kommunikation: Unterrichtsstunde im Wirtschaftsgymnasium. 
98 Auf der begleitenden Website www.bubenhofer.com/visuallinguistics/ kann die Anwendung 
online ausprobiert werden. 
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Im Verlauf des Gesprächs ergeben sich somit Spuren, ähnlich Jahresringen eines 
Baumes, allerdings mit dem Unterschied, dass sich die Ringe nicht additiv umei- 
nander anlegen und die Ringe immer größer werden. Stattdessen orientiert sich 
die Größe des Kreises alleine an der turn-Länge, so dass im Ergebnis die Reihen- 
folge der turns nicht abgelesen werden kann, sich jedoch ein Profil der turn-Fre- 
quenz und turn-Längen ergibt. 

Mit dieser Form der Darstellung geht also die Sequenzialität des Gesprächs 
insofern verloren, als dass die Reihenfolge der turns keine Rolle mehr spielt 
(allerdings gibt diese das nebenstehende Transkript nach wie vor wieder). Jedoch 
wird der von Deppermann als elementar bezeichnete Aspekt der Zeitlichkeit des 
Gesprächs sichtbar, indem die Geschichte der verbalen Interaktion anhand des 
turn-Profils sichtbar wird. Dieser Mechanismus ist besonders dann interessant, 
wenn man Ergebnisse verschiedener Gespräche miteinander vergleicht (Abbil- 
dung 108). Das in der Mitte abgebildete Gespräch ist das gleiche wie in Abbil- 
dung 107. Obwohl es noch zwei weitere Akteure gibt, ist es geprägt durch den 
Dialog der beiden Sprecherinnen, die formal bezüglich turn-Längen ein ähnli- 
ches Gesprächsverhalten zeigen: Es findet sich die ganze Palette von kurzen und 
längeren turns mit einem Gewicht auf mittellangen turns. 


Abb. 108 : Drei Gespräche im Vergleich: Spielinteraktion mit Kindern, Pausenkommunikation 
zweier Besucherinnen im Theater, Unterrichtsstunde Gymnasium 


Das Gespräch links in Abbildung 108 gibt eine Spielsequenz eines Vaters mit zwei 
Kindern wieder. Der Vater ist mit Position links oben (grün) dargestellt. Auch hier 
finden sich bei allen Beteiligten die ähnliche Palette von turn-Längen, auffallend 
ist aber der Vater, der besonders viele turns äußert, die zudem eher kurz sind. 
Die turn-Profile der Kinder ähneln sich und heben sich gleichzeitig deutlich vom 
Profil des Vaters ab. 

Nochmals von anderem Charakter ist die dritte Darstellung ganz rechts 
in Abbildung 108. Es handelt sich um eine Interaktion in einer Schulklasse. 
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Unschwer ist die Lehrerin mit den meisten Gesprächsbeiträgen erkennbar und es 
ist deutlich, wer unter den Schülerinnen und Schülern mehr oder weniger betei- 
ligt ist. 


Abb. 109: Zwei verschiedene Zeitpunkte im gleichen Gespräch (Pausenkommunikation Theater) 


Die Darstellung kann aber auch verwendet werden, um die turn-Profile zu ver- 

schiedenen Zeitpunkten im gleichen Gespräch zu analysieren (vgl. Abbildung 

109). Das Beispiel zeigt wieder den Dialog zwischen den beiden Theaterbesuche- 

rinnen zu zwei unterschiedlichen Zeitpunkten. Beim zweiten Zeitpunkt (rechts) 

ist das Gespräch inzwischen geprägt von längeren turns, wo es um eine inhaltli- 
che Diskussion geht, während beim früheren Zeitpunkt bislang noch eher orga- 
nisatorische turns geäußert worden sind. 

Technisch gesehen ist die Anwendung ‚Jahresringe‘ in Javascript unter Ver- 
wendung der Javascript-Bibliothek „Paper.js“” erstellt. Diese Bibliothek verein- 
facht die dynamische Erstellung von Vektorgrafiken mit Javascript auf Basis der 
HTMLS5-Canvas-Technologie. Das Script liest automatisch das in HTML verfügbare 
Transkript aus und erstellt daraus das Diagramm. 

Die Anwendung ist ein erstes Modell, das dazu dienen kann, die Eignung in 
Bezug auf die analytischen Bedürfnisse von Gesprächen zu testen. Viele weitere 
Ausbaustufen sind denkbar: 

- Bessere Integration der verbalen Informationen, indem beispielsweise im 
Verlauf des Gesprächs wieder aufgenommene Themen oder Konzepte als 
Stichwörter im Gesprächsraum stehen bleiben. Dafür könnte mit korpuslin- 
guistischen Mitteln zu jedem Zeitpunkt des Gesprächs berechnet werden, 


99 Vgl. www.paperjs.org (letzter Zugriff: 22. 9.2020). 
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welche Worter auffallig sind, weil sie beispielsweise neu auftauchen oder 
aber im Gespräch bleiben. 

— Dynamischere Darstellung der Gesprächsdominanz, etwa indem bei wieder- 
holter Gesprächsübernahme sich die ganze Anordnung so dreht, dass der/ 
die dominante Sprecher/in oben steht oder aber mehr Raum einnimmt. 

- Daneben sind viele Erweiterungen des Benutzerinterfaces denkbar, etwa 
Interaktivität, um sich jederzeit die Inhalte der turns wieder anzeigen lassen 
zu können, ein Zeitstrahl, um beliebig vor- und zurückspulen zu können etc. 


Wichtig ist hier jedoch der Punkt, dass diese Darstellung nicht das Transkript 
ersetzen, sondern ergänzen soll. Und noch wichtiger ist, dass die Visualisierung 
nicht losgelöst von bestimmten Forschungsinteressen entwickelt werden kann. 
Daher soll für den Moment auch bei dieser Skizze bleiben, die als Basis für weiter- 
gehende Entwicklungen dienen kann, die von bestimmten Forschungsinteressen 
ausgehen. 


8.3 Fazit und diagrammatische Verortung 


Ausgangspunkt der Überlegungen für die dritte Fallstudie war, dass die inter- 
aktionale Linguistik mit neueren Theorien an Grenzen stoßen müsste, wenn sie 
für die Analyse weiterhin die klassischen Formen der Transkription von Gesprä- 
chen nutzt. Gesprächstrankriptionen, auch in ihrer digitalen Variante oder ange- 
reichert um weitere Spuren zur Integration von Videoaufnahmen, nonverbalen 
Zeichen oder zur Bewegung im Raum, folgen der diagrammatischen Grundfigur 
der Partitur. Diese Form führt weder zu einer Rekontextualisierung noch zu einer 
Desequenzialisierung, reichert die Daten jedoch mit raumzeitlichen Informatio- 
nenan. 

Um aber insbesondere Aspekte von Zeitlichkeit und Sozialität (Deppermann 
2015, 327) von Gesprächen besser analysierbar zu machen, ist es angebracht, 
über die Verwendung anderer diagrammatischer Grundfiguren nachzudenken. 
So ist es beispielsweise schwer, anhand eines klassischen Gesprächstranskrip- 
tes den Verlauf der vorherigen Interaktionen komplett im Blick zu haben, um 
die aktuelle Situation zu rekonstruieren. Auch um die Beteiligungsstruktur des 
gesamten Gesprächs, zumindest in komplexeren Fällen, überblicken zu können, 
bedarf es einer eingehenden und wiederholten Lektüre der Transkription. Daher 
muss die Verwendung der diagrammatischen Grundfigur Partitur, die den Tran- 
skripten zugrunde liegt, in Frage gestellt werden, um einen neuen Blick auf die 
Daten gewinnen zu können. Alternativen sind Grundfiguren, die Sequenzialität 
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modellieren können, gleichzeitig aber eine Daten aggregierende Perspektive 
ermöglichen. 


Die auf der Basis der Figur der Jahresringe entwickelte Darstellung versucht 


Sequenzialität mit dieser aggregierenden Perspektive zu verbinden. Zudem stellt 
sie eine Fläche dar, mit der ein sozial konstituierter Gesprächsraum repräsen- 
tiert wird. Dabei spielen drei diagrammatische Grundfiguren eine wichtige Rolle: 
Liste, Graph und Karte. 


Karte: Die Definition der Fläche und der Positionierung der Sprechenden auf 
dieser Fläche folgt einer nichtgeografischen Karte mit einer räumlichen Ver- 
ortung der Akteure. Es handelt sich jedoch nicht um die Abbildung des realen 
Gesprächsraumes, sondern um den Entwurf einer Ähnlichkeit, mit der zwar 
die realen Akteure und ihre potenziellen Relationen untereinander abgebil- 
det werden, allerdings durch die gleichmäßige Anordnung der Akteure auf 
einem Grundkreis in einem neutralen Relationensystem. Akteure, die beson- 
ders intensiv miteinander interagieren sind nicht näher zueinander gesetzt. 
Erst im Verlauf des Gespräches und dem damit parallel sich verändernden 
Diagramm vollzieht sich auf diagrammatischer Seite eine Gewichtung der 
Relationen zwischen den Akteuren. Der in Abbildung 108 gezeigte Vergleich 
dreier Gespräche zeigt dies: Mit der Auflistung der turns als Kreise um die 
Akteurspositionen herum ergibt sich eine Gewichtung der Positionen im 
Gesprächsraum. 

Liste: Die Auflistung der Kreise, die turns repräsentieren, folgt der diagram- 
matischen Grundfigur der Liste und ist das entscheidende Prinzip, mit dem 
die aggregierende Sicht auf die Daten ermöglicht wird. Als ob die turns als 
Text in einer Liste aufgelistet würden, wird auch hier eine Liste erstellt, die 
aber grafisch funktioniert, um deutbare Spuren im Gesprächsraum hinter- 
lassen zu können. Das Ensemble der Kreise, als Liste gelesen, weist Paral- 
lelen zum Schnitt durch einen Baumstamm auf, in dem die Jahresringe die 
Geschichte des Baumwachstums darstellen. 

Graph: Schließlich nimmt die Visualisierung Anleihen an der diagramma- 
tischen Grundfigur Graph, wenn die grafischen turn-Listen der Akteure als 
Knoten in einem Netz, angeordnet auf einem ordnenden Kreis, wahrgenom- 
men werden. Dieser Aspekt ist bis jetzt kaum ausgebaut: Würde das Dia- 
gramm stärker als Graph aufgefasst, könnten die Knoten ihre Position verän- 
dern, etwa in Abhängigkeit der Veränderung der Beteiligungsstruktur. 


Die im Abschnitt oben skizzierten Ausbaustufen zeigen, dass mit den „Jahresrin- 
gen“ ein Visualisierungsprinzip gefunden ist, das einen weiten Möglichkeitsraum 
eröffnet. Es ist mit anderen Diagrammen kombinierbar und ausbaubar; insofern 
kann von einem reichen Visualisierungsprinzip gesprochen werden. 
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Die Coding Culture, in der dieser Prototyp entstanden ist, ist ähnlich mit derjeni- 
gen, die bei den Geokollokationen und den Narrativen wirkte. Eine kleine Abwei- 
chung ist insofern feststellbar, als dass die dafür verwendete Javascript-Biblio- 
thek „Paper.js“ eine andere Zielgruppe anspricht als etwa die D3.js-Bibliothek. 
Ein Blick auf die auf der Website der Bibliothek aufgeführten Beispiele!° macht 
dies evident, da es kaum darum geht, nur Daten zu visualisieren, sondern ein 
viel breiterer Anwendungsbereich ersichtlich wird: Grafik, interaktives Design 
und digitale Kunst. Mit einer solchen Bibliothek ist deutlich mehr Aufwand nötig 
als etwa mit D3.js, um eine kanonische Datenvisualisierung zu programmieren, 
dafür verleitet sie dazu, ganz andere Formen digitaler Grafik auszuprobieren. 

Dieser Ansatz verstößt gegen bestimmte Prinzipien der Gesprächsanalyse 
und der Transkription. So wird in vielen Anleitungen zur Gesprächstranskrip- 
tion betont, dass eine detaillierte und genaue Transkription unumgänglich 
sei, so bereits Sacks et al., die eine Transkription auf einem „appropriate level 
of detail and precision“ (Sacks et al. 1974, 734) fordern, oder Deppermann der 
betont, dass das „genaue Hinhören und die ‚demütige‘ Verschriftung von Details, 
so merkwürdig, widersinnig oder unwichtig sie auch zu sein scheinen“ (Depper- 
mann 2008, 40), entscheidend sind. 

Diese Forderung, grundsätzlich alle Aspekte eines Gesprächs zunächst für 
relevant zu halten und zu dokumentieren, ist zweifellos wichtig und war wis- 
senschaftshistorisch innovativ. Gleichzeitig besteht die Gefahr, allzu sehr einem 
bestimmen Denkstil verhaftet zu sein, mit dem andere Perspektiven auf gespro- 
chene Sprache, stärker quantitative, abstrahierende und generalisierende, nicht 
auf der Hand liegen. Ein diagrammatischer Blick und das Experiment mit unor- 
thodoxen diagrammatischen Grundfiguren, im vollen Bewusstsein der dadurch 
ausgelösten Veränderungen bei der Gegenstandskonstitution, mag ein Weg sein, 
neue Innovationen auszulösen. 


100 Vgl. http://paperjs.org/examples/ (letzter Zugriff: 22. 9.2020). 
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9 Integrierte diagrammatische Methodologie 


Wo stehen wir nun? In den beiden Teilen Grundlagen und Praktiken versuchte 
ich, fiir eine diagrammatische Sichtweise auf linguistische Forschungspraktiken 
zu plädieren. Es sollte deutlich geworden sein, wie diagrammatische Grundfigu- 
ren Untersuchungsgegenstande hervorbringen, wie diagrammatische Praxis von 
Denkstilen durchdrungen ist und welch entscheidenden Anteil an diesen Ope- 
rationen der Computer einnimmt, der als diagrammatische Maschine verdatete 
Sprachgebrauchsdaten transformiert. 

Im Fazit geht es mir nun schließlich darum, aus diesen Beobachtungen und 
Analysen eine diagrammatische Methodologie zu synthetisieren. Diese Metho- 
dologie soll aber keine Handlungsanweisung sein, um „bessere“ Diagramme zu 
erzeugen oder eine Evaluationsform vorzuschlagen, um Diagramme zu evaluie- 
ren. Sie soll eher als Orientierungsrahmen verstanden werden, mit dem die lingu- 
istische diagrammatische Praxis besser reflektiert werden kann. 

Ich werde zunächst nochmals die Bandbreite diagrammatischen Operierens 
in sprachwissenschaftlichen Kontexten aufgrund der bisher gemachten Beobach- 
tungen und Überlegungen aufspannen. Danach geht es um die Frage, wie dieser 
methodologische Orientierungsrahmen diagrammatischer Praxis so gewendet 
werden kann, dass damit ein spezifisches Problem eines Fachs in den Geisteswis- 
senschaften, das Methoden anderer Disziplinen verwendet, beleuchtet: Nämlich 
das Verhältnis von maschinellen Analysen und Interpretation. 

Und schließlich möchte ich eine provokante Richtung einschlagen und dafür 
optieren, neue diagrammatische Transformationen zu suchen, die gegen Denk- 
stile und entsprechende Kanons verstoßen und quer zur Praxis liegen, um neue 
Untersuchungsgegenstände zu formen und damit neue Sinnangebote zu schaf- 
fen. 


9.1 Diagrammatische Operationen zwischen Code und 
Interpretation 


Diagrammatische Transformationen, in einem umfassenden Sinn verstanden, 
der auch Datentransformationen umfasst, sind Dreh- und Angelpunkte wissen- 
schaftlichen Arbeitens. Ein linguistisches Forschungsvorhaben geht meist auch 
mit einer impliziten oder expliziten Entscheidung für eine diagrammatische 
Grundfigur (Kapitel 5) einher, mit der Daten im Jäger’schen Sinn ein erstes Mal 
transkribiert und damit deutbar gemacht werden. Dabei kommt es zu Effek- 
ten, die für sprachliche Daten mit Rekontextualisierungen, Desequenzialisie- 
rungen, Dimensionsanreicherungen und Rematerialisierungen gefasst werden 


@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
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können (Abschnitt 5.6). Diese Effekte können gezielt genutzt werden, um durch 
die Transkription bestimmte Aspekte der Daten hervortreten oder verschwinden 
zu lassen. Werden diese Effekte jedoch nicht erkannt und reflektiert, führen die 
diagrammatischen Transformationen zu Simplifizierungen der Daten. Für die 
Linguistik ist beispielsweise der Effekt der Desequenzialisierung von entschei- 
dender Bedeutung: Viele diagrammatischen Transformationen brechen die 
Sequenzialität von sprachlichen Äußerungen auf und behandeln sie als „Bag of 
Words“. Viele Methoden nutzen genau diese Konzeption von Text oder Gespräch 
zusammengefasst als Sack von Wörtern (oder andere sprachlichen Einheiten) 
und ermöglichen dafür eine Reihe von Transformationen, die ansonsten nicht 
möglich wären. 

Der Verlust einer Eigenschaft wie Sequenzialität geht jedoch mit einem 
Verlust an Perspektiven einher. Mit einem „Bag of Words“-Ansatz sind Fragen 
nach Dynamik innerhalb des Sackes, also des Textes, müßig — solche Methoden 
präferieren eine Konzeption von Sprache, bei der Texte, oder die Einheit, die als 
Sack aufgefasst wird, als kleinste zu interessierende Einheit definiert wird. Die 
Binnenstruktur innerhalb eines Textes ist dabei nicht mehr von Belang. 


Diagrammatische Grundfiguren 
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Abb. 110: Integrales Modell diagrammatischen Operierens in der Linguistik 
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Visualisierungen ermöglichen unterschiedliche diagrammatische Praktiken: Ent- 
weder dienen sie eher der Präsentation oder aber der Exploration von Daten. Dia- 
grammatische Operationen entfalten sich besonders dann, wenn die Visualisie- 
rung darauf angelegt ist, Daten überblickbar und damit in Bezug auf bestimmte 
Aspekte überhaupt erst analysierbar zu machen, sie also als Werkzeug dienen, 
um Transformationen und Interpretationen vorzunehmen. 

Die Diagramme erfüllen darüber hinaus unterschiedliche Repräsentations- 
funktionen: Sie können Daten zeigen oder zusammenfassen oder aber Modelle 
repräsentieren oder Modelle anwenden. 

Bei Visualisierungen, die mit Hilfe des Computers entstehen oder gar in die 
diagrammatischen Prozesse der Datentransformationen komplett eingebunden 
sind, spielen Coding Cultures eine wichtige Rolle bei den Transformationspro- 
zessen. Man kann sich in einer Hacking-Kultur bewegen, die von Open Source, 
White Box, Entprofessionalisierung und Selbstermächtigung geprägt ist - oderin 
einer kommerziell-proprietären Kultur, sowie allen möglichen Zwischenformen. 
Je nach Coding Culture, in der man sich bewegt, entstehen unterschiedliche Visu- 
alisierungen, die unterschiedliche diagrammatische Transformationen nahele- 
gen. Bewegt man sich beispielsweise in der Open Source Javascript-Kultur und 
sieht in den zu analysierenden Daten eine Netzstruktur, ist es wahrscheinlich, 
dass eine der verfügbaren Javascript-Bibliotheken genutzt wird, die bestimmte 
Programmiertechniken, Funktionen und auch eine bestimmte Ästhetik nahele- 
gen. Es ist also nur in wenigen Fällen so, dass die Analyse des Visualisierungs- 
problems und die sich daraus ergebenden Anforderungen an die technische und 
gestalterische Umsetzung als zwei getrennte und aufeinander folgende Schritte 
praktiziert werden. Die Coding Culture, in der man sich bewegt, nimmt das Ergeb- 
nis der Visualisierung bis zu einem gewissen Grad vorweg. 

Das Zusammenspiel von Daten, diagrammatischer Grundfigur und Coding 
Culture führt dann zu Visualisierungsprinzipien, die eher reich oder arm sind, 
also einen mehr oder weniger großen Möglichkeitsraum der Operationen und 
Transformationen zulassen. Reiche Visualisierungsprinzipien haben dabei eher 
das Potenzial, Kanons und Denkstile zu durchbrechen. Ärmere Visualisierungs- 
prinzipien hingegen bewegen sich eher im Kanon und damit im Denkstil der Dis- 
ziplin. 

Einzelne Diagramme können nun innerhalb dieses Modells verschiede- 
ner Aspekte verortet werden. Abbildung 110 zeigt ein Diagramm, mit dem Dia- 
gramme bezüglich der herausgearbeiteten Kriterien verortet werden können. Es 
geht dabei aber nicht darum, allgemeingültige Klassifikationen von Diagrammen 
festzulegen, sondern das Modell und dessen diagrammatische Gestalt dienen als 
Wegweiser für eigene Fragestellungen, in die diagrammatische Aspekte involviert 
sind. Hinsichtlich einer reflexiven Haltung gegenüber dem eigenen diagramma- 
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tischen Vorgehen zeigt es die Aspekte, die bedacht werden müssen. Damit ist 
immer auch die Arbitrarität der jeweiligen Position im Modell verbunden, denn: 
Es gibt immer eine Wahl, die Visualisierung bezüglich der genannten Aspekte 
auch anders zu erstellen. Das Modell zeigt, wie man zu den möglichen Alternati- 
ven gelangen kann. 

Ein Beispiel soll das illustrieren: Für eine gesprächslinguistische Fragestel- 
lung entscheidet man sich dazu, die Daten zu transkribieren. Das geschieht in 
Partiturschreibweise mittels des Editors EXMARaLDA und nach der Transkripti- 
onsrichtlinie GAT 2. Im Modell verortet sich ein solches Transkript bei folgenden 
Ausprägungen der Kategorien: 

-  Diagrammatische Grundfigur: Partitur 
-  Diagrammatische Effekte: 

- Dimensionsanreicherung 

-  Rematerialisierung 
- Diagrammatische Funktion: Daten repräsentieren 
— Diagrammatische Praxis: Exploration 
-  Visualisierungsprinzip: eher arm 
- Coding Culture: 

- Closed Source (der Quellcode des Programms ist nicht öffentlich) 

- eher White Box (die Funktionsweise ist - obwohl der Quellcode nicht 

öffentlich ist — relativ transparent) 

- professionell (Einschätzung von außen, da der Quellcode nicht öffent- 

lich ist) 

- abhängig (bei der Benutzung ist man an das grafische Benutzerinterface 

gebunden) 


Selbstverständlich ist diese Verortung diskussionswürdig. Insbesondere die 
Frage, ob der Möglichkeitsraum für weitere Transformationen und Operationen 
des Visualisierungsprinzips eher arm oder reich ist, kann keine klar zu entschei- 
dende Frage sein. Dass ich das Gesprächstranskript als „eher armes“ Visualisie- 
rungsprinzip charakterisieren würde, liegt darin begründet, dass in der Praxis 
die diagrammatische Grundfigur der Partitur in keinem Fall aufgebrochen oder 
ergänzt wird, gerade auch, wenn Audio- oder Videospuren damit aligniert 
werden. Wichtig ist jedoch weniger Einigkeit über die Einschätzung. Wichtiger 
ist, dass die Kategorien einen dazu zwingen, das Diagramm unter diesen Aspek- 
ten zu bewerten und damit die ganze Bandbreite der Faktoren, die die diagram- 
matische Praxis beeinflussen, deutlich wird. 

In Abbildung 110 sind neben dem klassischen Gesprächstranskript im 
Kontrast dazu das Jahresringe-Diagramm (vgl. Abschnitt 8.2.2) und die Geo- 
kollokationen-Anwendung (vgl. Abschnitt 6.2.3) eingetragen. Aus Gründen der 
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Ubersichtlichkeit werden nicht alle zutreffenden Aspekte den Diagrammtypen 
zugewiesen, sondern nur fiir den jeweiligen Typus besonders relevante. Und 
zudem habe ich einige besonders wichtige Aspekte durch eine starkere Strich- 
dicke hervorgehoben. Nun ist beispielsweise ersichtlich, dass das Jahresringe- 
Diagramm auf mehrere diagrammatische Grundfiguren zurückzuführen ist, was 
beim Gesprächstranskript nicht der Fall ist. 

Wenn ein Diagramm bezüglich der herausgearbeiteten Aspekte verortet 
wird, können danach alternative Diagramme abgeleitet werden, die bezüglich 
bestimmter Aspekte, also bezüglich Effekte, Funktionen, diagrammatischer 
Praxis etc., anders zu charaktersieren sind. Dies ist mit der These verbunden, 
dass eine Alternative zu einem Diagramm erst dann entsteht, wenn mindestens 
einer dieser Aspekte anders gesetzt wird. Im Fall des Gesprächstranskripts wäre 
etwa zu überlegen, ob eine Desequenzialisierung (als Ergänzung) nicht auch ein 
wünschenswerter Effekt wäre, der einen neuen Blick auf die Daten ermöglichen 
würde. Oder es wäre zu prüfen, ob die Funktion der Datenzusammenfassung 
nicht interessante Erkenntnisse bringen würde. Damit werden jeweils andere 
diagrammatische Grundfiguren und damit Visualisierungsprinzipien möglich 
und es kommt zu einer anderen Art der Gegenstandskonstitution. Diagramm- 
Alternativen, die die gleichen Aspekte nutzen, führen nicht zu neuen Visualisie- 
rungsprinzipien und von ihnen ist auch kein bedeutender Einfluss auf die Gegen- 
standskonstitution zu erwarten. 

Es versteht sich von selbst, dass solche Entscheidungen Hand in Hand mit 
den Forschungsfragen, die verfolgt werden sollen, gehen. Hand in Hand bedeu- 
tet in diesem Fall aber auch, dass nicht zwingend die Forschungsfrage voraus 
gehen muss, und davon das Diagramm abgeleitet wird, sondern dass auch der 
umgekehrte Weg gegangen werden kann, gerade, wenn es konkret darum geht, 
herrschende Denkstile in Frage zu stellen oder zu umgehen. 


9.2 Daten deuten und verstehen 


Die Transformationen von mittels Computer Verdatetem ähneln sich, egal ob es 
sich beim Verdateten um Sprachdaten, Messwerte oder Umfragedaten handelt. 
Das ist der Clou des Metamediums Computer. Auch die Formen der Formatierung 
und Visualisierung auf Bildschirmen, Druckern, 3D-Brillen etc. ähneln sich oft. 
Es ist deswegen naheliegend, dass sich der Sprachwissenschaftler mit der Infor- 
matikerin, dem Computerlinguisten, der Textminerin und der Statistikerin aus- 
tauscht, um gegenseitig Methoden, Werkzeuge und Programmcode zu nutzen. 
Wir selbst gingen so vor, um Korpora aufzubereiten, auszuzeichnen und auszu- 
werten. 
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Mit Fleck gesprochen unterscheiden sich Disziplinen oder Bereiche aber teilweise 
markant durch ihre unterschiedlichen Denkstile und Forschungslogiken. Ein Bei- 
spiel seien zwei eigentlich nahe Disziplinen: Linguistik (bis hin zu Korpuslinguis- 
tik) und Computerlinguistik. Deutlich werden die unterschiedlichen Denkstile an 
einer Fragestellung, die beide Disziplinen beschäftigt: Autorschaftsattribution. 
Die Frage ist also, welche Merkmale eines Textes typisch für den Stil eines Autors 
oder einer Autorin sind um einen Text mit unbekannter Autorschaft einer Person 
zuordnen zu können. Typischerweise ist zur Beantwortung dieser Frage das fol- 
gende Setting üblich: Es gibt eine Menge von Texten mit bekannter Autorschaft. 
Aufgrund dieser Texte trainiert man ein statistisches Modell, das die Autorschaft 
für einen Text voraussagen kann. Dieses Modell evaluiert man an Texten, deren 
Autorschaft bekannt ist und kann es dann an Texten mit unbekannter Autor- 
schaft anwenden, um eine Prognose über die Autorschaft abzugeben. 

Die Kalibration dieses Settings erfolgt über die Merkmale („Features“), mit 
denen das Modell trainiert werden soll, sowie über die Auswahl des statistischen 
Modells. Diagrammatisch gesehen werden die Texte in einen Vektorraum über- 
führt, indem die Häufigkeiten der Merkmalsausprägungen pro Text gemessen 
werden. Ein einfaches Beispiel sind Wortformen: Ein Text wird in einen Vektor 
überführt, der die (ggf. gewichteten) Häufigkeiten aller Wortformen im Korpus 
repräsentiert. Aus diagrammatischer Perspektive wird zunächst ein Index der vor- 
handenen Wortformen (diagrammatische Grundform der Liste, Effekt der Rekon- 
textualisierung) und daraus die Vektorrepräsentation erstellt (diagrammatische 
Grundform Vektor). Dies ist gleichzeitig ein weiterer Schritt der Verdatung, da 
nun Texte als Zahlenvektoren repräsentiert werden können (vgl. dazu für Details 
Abschnitt 4.1). Nun können im Vektorraum Ähnlichkeiten der Texte berechnet 
werden, indem die Distanz zwischen den Vektoren berechnet wird. Und natür- 
lich kann der Vektorraum in ein grafisches Diagramm formatiert werden, wobei 
dabei eine Dimensionsreduktion vom n-dimensionalen Raum (n = Anzahl Wort- 
formen-Types) in zwei oder allenfalls drei Dimensionen gemacht werden muss, 
um die Vektoren in einem x-y- (ggf. z-)Koordinatenraum auf einer Fläche darstel- 
len zu können. Im Vektorraum müssten sich im Idealfall dann Texte der gleichen 
Autorschaft clustern, d.h., die Vektoren dieser Texte müssten in eine ähnliche 
Richtung zeigen. Die Feststellung dieser Cluster kann dann wiederum ein Algo- 
rithmus übernehmen, der dann eben typische Vektorrepräsentationen für alle 
Texte eines Autors/einer Autorin modelliert. Der Vektor eines Textes mit unbe- 
kannter Autorschaft kann nun in der Distanz zu den typischen Vektoren verortet 
werden — wenn er genug nahe an einem typischen Vektor der Texte eines bekann- 
ten Autors/einer bekannten Autorin ist, kann nun - je nach Distanz - sicherer 
oder weniger sicher die Autorschaft prognostiziert werden. 
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Wortformen generell und alleine sind aus linguistischer Sicht keine ausreichen- 
den Merkmale, um den Autorschaftsstil zu bestimmen. Denkbar wäre, zusätzlich 
Satzkomplexität, Wortwahl in einem semantischen Paradigma, orthographische 
Varianten oder morphosyntaktische Auffälligkeiten zu modellieren, also Merk- 
male, die komplexer sind als Wortformen und theoretische Annahmen der Lin- 
guistik berücksichtigen. 

Besonders erfolgreich ist bei vielen Aufgaben der Autorschaftsattribution 
aber ein sehr viel einfacheres Merkmal: „low-level features like character n-grams 
are very successful for representing texts for stylistic purposes“ (Stamatatos 2009, 
24). Buchstaben-n-Gramme, Sequenzen von Buchstaben, genügen offensichtlich 
zur Modellierung von Stil, wobei es sich also um ein Merkmal handelt, für dessen 
Bestimmung kein linguistisches Wissen relevant ist. 

Der Erfolg dieses Merkmals kann mittels Evaluation an einem Goldstan- 
dard, also einem manuell klassifizierten Datensatz, nachgewiesen werden. Dabei 
werden normalerweise Präzisions- und Ausbeute-Werte berechnet. Die Werte 
sagen aus, wie präzise das Modell ist (also wie viele der einem Autor / einer 
Autorin zugewiesenen Texte richtig zugewiesen worden sind) und wie gut die 
Ausbeute, also wie viele der zu einem Autor / einer Autorin gehörenden Texte 
gefunden worden sind. Wenn sowohl Präzision als auch Ausbeute hoch sind, 
wird davon ausgegangen, dass das Modell präzise ist und nicht-klassifizierte 
Texte sicher klassifzieren kann. 

Funktioniert das Modell, können darauf aufbauend Werkzeuge konstruiert 
werden, etwa eines, das die Autorschaft von Erpresserbriefen prognostiziert und 
so Gerichtsfälle lösen kann. Die Konstruktion solcher Werkzeuge - natürlich 
auch für ganz andere Zwecke - ist normalerweise das Interesse in der Computer- 
linguistik. Aus linguistischer Perspektive hingegen mag aber primär Verwunde- 
rung darüber empfunden werden, dass ein statistisches Modell auf der Basis von 
Buchstaben-n-Grammen überhaupt funktioniert. Daraus ergibt sich die Frage, 
was mit Buchstaben-n-Grammen eigentlich gemessen wird. Das ist aber unklar, 
denn Buchstaben-n-Gramme könnten bestimmte Wortpräferenzen abbilden, die 
zufälligerweise über ein Buchstaben-n-Gramm erfasst werden. Es könnten auch 
bestimmte Flexionsendungen sein, die wiederum typisch für bestimmte morpho- 
syntaktische Merkmale sind oder es könnte sogar Satzkomplexität mitgemessen 
werden, da ein bestimmtes n-Gramm eine Konjunktion repräsentiert. Während 
diese Aspekte als Ausdruck von Autorschaftsstil angesehen werden können, 
drücken die Buchstaben-n-Gramme aber auch Themen oder Textsorten aus, die 
nicht als stilistische Ausprägungen aufgefasst werden können. Die Buchstaben- 
n-Gramme repräsentieren also einen bunten Strauss unterschiedlicher Textmerk- 
male, von denen nicht alle als Ausdruck von Autorschaftsstil angesehen werden 
können, wobei aber nicht mal bekannt ist, welche der genannten Aspekte über- 
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haupt eine Rolle spielen. Das Modell ist also nicht valide, da unklar ist, was es 
misst. 

Wenn ein Modell primär als Bestandteil eines Werkzeugs benutzt wird, das 
eine klar umrissene Aufgabe hat, mag fehlende Validität verschmerzbar sein. 
Ein solcher Fall ist die automatische Erkennung von Spam-E-Mail-Nachrichten, 
bei der eine statistische Modellierung von Spam-Nachrichten verwendet wird. 
Aber bei einem linguistischen Interesse auf ein solches Phänomen ist Validität 
wichtig, um das Ergebnis interpretieren zu kénnen.*” Ein statistisches Modell 
dient im Rahmen einer linguistischen Forschungsfrage dazu, eine Zusammen- 
fassung der Daten auf einer generalisierbaren Ebene zu leisten, aber so, dass das 
Modell deutbar ist. Dafür muss dessen Funktionsweise und die entscheidenden 
Merkmalsausprägungen zur Beschreibung der Daten bekannt sein. Damit werden 
die unterschiedlichen Interessen in Bezug auf die Analyse sprachlicher Daten 
deutlich sichtbar: Einerseits geht es darum, die Daten deuten und verstehen zu 
können, andererseits darum, beschreiben und prognostizieren zu können. 

Aus geisteswissenschaftlicher Position wird damit deutlich, dass ein Ergeb- 
nis maschineller Datentransformation und statistischer Modellierung — mit Jäger 
gesprochen - ein neues Script darstellt, das genauso gedeutet werden muss, wie 
ein Text, der vielleicht am Anfang der ganzen Transformationskette stand. Um 
dies erfolgreich machen zu können, müssen die entstandenen Daten als Ergebnis 
von diagrammatischen Transformationen verstanden werden können. Da dia- 
grammatische Transformationen und die damit möglichen Operationen gegen- 
standskonstituierend sind, muss reflektiert werden können, welche Gegenstände 
mit den Analysen entstanden sind und weiter interpretiert werden. Aus geistes- 
wissenschaftlicher Sicht ist es also elementar, Methoden, die beispielsweise in 
der Statistik, Informatik oder Computerlinguistik unter anderen wissenschafts- 
theoretischen Prämissen entwickelt worden sind, diagrammatisch zu verstehen 
und abzuschätzen, ob sie für das jeweilige Untersuchungsinteresse geeignet sind. 


101 Auch in vielen weiteren Bereichen ist Validität statistischer Methoden wichtig. Man denke 
im Fall der Autorschaftsattribution an die Verwendung dieser Methode vor Gericht, um beispiels- 
weise ein Erpresserschreiben einer verdächtigen Person zuschreiben zu können. Es wäre mora- 
lisch nicht vertretbar, eine Person auf der Basis eines statistischen Modells zu verurteilen, das 
nicht valide ist, also nicht verstanden wird. Vgl. für eine kritische Diskussion verschiedener Me- 
thoden zur Autorschaftsattribution aus korpuslinguistischer Sicht die Blogbeiträge von Joachim 
Scharloth: http: //www.security-informatics.de/blog/?tag=authorship-detection (22. 9. 2020) und 
generell zur Gefahr von Black-Box-Systemen des maschinellen Lernens aus gesellschaftlicher 
Perspektive O’Neil (2016). Ferner gehen Bubenhofer (2018e) und Bubenhofer / Dreesen (2018) 
auf den weiteren Zusammenhang von Black-Box-Systemen aus linguistischer Perspektive ein. 
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9.3 Chancen für neue Transformationen 


Zuletzt möchte ich die Frage nach dem innovativen Potenzial diagrammatischer 
Operationen stellen. Hierzu sei Krämer zitiert: 


Inskribierte Flächen machen nicht nur sichtbar, sie machen höchst erfinderisch. Die Ein- 
bildungskraft findet in diesem artifiziellen Sonderraum einen intersubjektiv teilbaren Ort. 
(Krämer 2016, 17) 


Je stärker der Möglichkeitsraum eines Visualisierungsprinzips beschränkt wird 
durch einen, einem bestimmten Denkstil verhafteten, Kanon, desto weniger 
kann von der Erfindungskraft der inskribierten Fläche profitiert werden. Diesen 
Zusammenhang sieht auch Mark Lauersdorf und verweist dabei sogar auf eine 
Gefahr, die von ikonisch gewordenen Visualisierungen ausgeht: 


[...] we would be wise to question ourselves regarding some of the standard visualiza- 
tions that have become iconic in our areas of study. Have we objectified these visualiza- 
tions thereby fixing (locking in) their form and rendering them immutable/unchangeable 
(iconic)? And do we interpret all new information and arguments through these fixed forms, 
potentially focusing, in our subsequent analyses, more on the visualization than on the 
information behind it? And what are we missing if we are, in fact, doing this? (Lauersdorf 
2018, 109) 


Lauersdorf macht also auf die Gefahr aufmerksam, dass ikonisch gewordene Visu- 
alisierungen zu starren Analyseinstrumenten werden, die bestimmte Interpreta- 
tionen bevorzugt entstehen lassen. Solche Visualisierungen machen es schwer, 
die dahinterliegenden Daten oder Informationen anders zu interpretieren, als es 
die Visualisierung nahelegt. Dies gilt für ein einzelnes Diagramm genau so wie 
für ein Visualisierungsprinzip, das für verschiedene Darstellungen immer wieder 
herangezogen wird. Es befördert einen bestimmten Denkstil und damit wird eine 
andere Sicht des Problems erschwert. 

Lauersdorf stellt deswegen eine einfache Forderung: „Use all the data!“ (Lau- 
ersdorf2018) Denn, so sein Argument, werden für eine linguistische Fragestellung 
alle verfügbaren Daten verwendet, ergeben sich daraus verschiedene Probleme 
des Datenhandlings, die gelöst werden müssen. Es müssen statistische Verfahren 
angewandt werden, um spezifische Aspekte zu testen, da die Daten nicht mehr 
manuell überblickt werden können. Und die Daten müssen visualisiert werden. 
Es handelt sich also zum großen Teil um diagrammatische Operationen und 
Transformationen, die nötig sind, um die facettenreiche Datengrundlage prozes- 
sieren zu können. Und dabei wird eine Kette von Handlungsaufforderungen aus- 
gelöst, die Lauersdorf wie folgt beschreibt: 
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> Use all the data. 

> If you use all the data, view all the data. 

> If you view all the data, view all the combinations. 

> If you view all the data, view all the angles. 

> If you view all the data, use all the techniques. (Lauersdorf 2018, 112) 


Die Forderung zielt also darauf ab, das Visualisierungsprinzip möglichst aus- 
zureizen — aber eigentlich auch mehr zu tun, nämlich alle Aspekte, die ich im 
Verlauf der vorliegenden Arbeit als relevant für die diagrammatische Praxis 
erkannt habe, zu reflektieren und damit zu operieren. Das bedeutet, um die 
Aspekte nochmals in aller Kürze zusammenzufassen: 


Diagramme lassen sich auf bestimmte diagrammatische Grundfiguren 
zurückführen. Für die Linguistik identifizierte ich die folgenden Grundfigu- 
ren als besonders relevant: Listen, Karten, Partituren, Vektoren und Graphen. 
Sie transformieren je auf ihre eigene Weise Daten und wirken gegenstands- 
konstituierend (Kapitel 5). 

Diagramme sind, wie alle Medien, transkriptive Verfahren im Sinne Ludwig 
Jägers, d.h., sie sind ein sinninszenierendes Verfahren der kulturellen 
Semantik, mit denen mediale Übersetzungen, Umgestaltungen und Umfor- 
mungen, also Transformationen, möglich werden. Durch diese Remediatisie- 
rung werden Diagramme und Daten neu semantisiert (Abschnitt 3.1). 
Diagrammatische Transformationen führen zu bestimmten Effekten, die sich 
auf die Daten auswirken. Es handelt sich dabei um Effekte der Rekontextua- 
lisierung, Desequenzialisierung, Dimensionsanreicherung und Remateriali- 
sierung. Je nach Untersuchungsinteresse sind diese Effekte erwünscht oder 
hinderlich (Abschnitt 5.6). 

In der diagrammatischen Praxis werden Diagramme entweder zur Präsenta- 
tion von Analyseergebnissen oder aber eher zur Exploration von Daten, mit 
denen diese überhaupt erst analysierbar gemacht werden, verwendet. Dabei 
ist aber zu bedenken, dass mit der Wahl bestimmter diagrammatischer Mittel 
der zu untersuchende Gegenstand auch immer auf eine bestimmte Weise mit- 
konstituiert wird (Abschnitt 2.3.1). 

Digitale, mit Programmcode erstellte Diagramme, werden im Rahmen einer 
bestimmten Coding Culture erstellt und verwendet. Die Wahl einer bestimm- 
ten Programmierumgebung, einer bestimmten Programmiersprache oder 
Bibliothek erfolgt nicht primär auf der Basis technischer Erwägungen, 
sondern ist durch die Coding Culture, in der man sich bewegt, geprägt. Die 
Coding Culture legt Aspekte fest wie Closed vs. Open Source, Black-Box- vs. 
White-Box-Verfahren, professionelle Implementierung oder Entprofessiona- 
lisierung sowie Abhängigkeit von Computern, Institutionen oder Konzernen 
vs. Selbstermächtigung (Abschnitt 4.4). 
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- Das Operieren mit Diagrammen in Form von Grafiken oder aber in Form von 
digitalen Repräsentationen, geht bei mit Programmcode erstellten Diagram- 
men ineinander über. Diagramme sind deshalb nicht das Endergebnis einer 
Datenanalyse, sondern diagrammatisches Operieren ist fester Teil jeglicher 
Datenanalyse von Beginn weg und bestimmt den Möglichkeitsraum der 
Transformationen mit (Abschnitt 4.3). 

- Die Kombination einer bestimmten diagrammatischen Grundfigur mit einem 
bestimmten Datentyp und bestimmten Transformationsverfahren ergibt ein 
Visualisierungsprinzip. Visualisierungsprinzipien können eher enge oder 
aber weite Möglichkeitsräume für diagrammatische Transformationen eröff- 
nen, so dass von armen und reichen Visualisierungsprinzipien gesprochen 
werden kann (Abschnitt 5.7). 

-  Diagrammatische Praktiken sind in allgemeinere wissenschaftliche Prakti- 
ken eingebettet, die wiederum Ausdruck von wissenschaftlichen Denkstilen 
sind. Diese Denkstile führen zu Kanonisierungen der diagrammatischen 
Praxis, die in Frage gestellt werden muss, wenn neue, innovative Visualisie- 
rungsformen und damit auch Gegenstandskonstitutionen und Perspektiven 
auf Sprache gewonnen werden sollen (Abschnitt 3.2 und 3.3). 


Diese Aspekte definieren Angriffspunkte, um neue diagrammatische Praktiken 
zu finden. Also wären — wie bereits beschrieben — Visualisierungen auf der Basis 
anderer diagrammatischer Grundfiguren zu wählen, andere Effekte zu nutzen, 
um andere Aspekte der Daten zu repräsentieren und eine andere Programmier- 
sprache oder Programmierumgebung auszuprobieren, um die Algorithmen für 
die Visualisierung zu implementieren. 

Das ist im Forschungsalltag in dieser Konsequenz nicht möglich. Ein Schritt, 
diesem Ideal näher zu kommen, ist das Hacking-Paradigma in die Wissenschafts- 
praxis zu übernehmen. Dies bedeutet: Do it yourself, teilen, voneinander lernen, 
experimentieren und zweckentfremden. 


9.4 Ausblick 


Welche grundlegenderen Folgen ergeben sich nun aus diesen Erkenntnissen für 
die Linguistik selber, jedoch auch für die benachbarten Disziplinen und die Dia- 
grammatologie? Zum Abschluss mögen die folgenden Beispiele und Überlegun- 
gen zu weiteren Ideen führen. 
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9.4.1 Neue diagrammatiko-linguistische, transsemiotische Perspektiven auf 
Sprachgebrauch 


Der Iconic Turn auf der Basis von Überlegungen von William J. T. Mitchell (1992, 
wiederabgedruckt 2013) und Gottfried Böhm (1994) erhofft sich einen zweifachen 
Nutzen des Fokus auf Bildlichkeit: Einerseits soll das Bildhafte an kulturellem 
Handeln anerkannt werden, andererseits sollen aber Bilder auch als Analyse- 
instrument von Kultur genutzt werden können: Bilder sind nicht nur „Zeichen, 
Abbilder oder Illustrationen; sie entfalten eine ganz eigene Wirkungsmacht, 
die sich der Sprache zu entziehen scheint“ (Bachmann-Medick 2006, 331). Ein 
Element dieser Wirkungsmacht (die ich im Buch mehrfach diskutiert habe) ist 
das erkenntnisfördernde Potenzial von Bildern: 


Wenn es im iconic turn ausdrücklich nicht nur darum gehen soll, Bilder zu verstehen, 
sondern die Welt durch Bilder zu verstehen, lässt sich also hier erst unter einer Grundbe- 
dingung von einem turn sprechen: dass die Gegenstandsebene (d.h. Bilder als Untersu- 
chungsgegenstand) gewissermaßen umschwenkt auf die Ebene der methodischen Einstel- 
lungen, dass Bilder somit selbst als Erkenntnismedien und Analysekategorien in den Blick 
kommen. (Bachmann-Medick 2006, 350) 


Wenn nun die Linguistik die Ideen des Iconic Turn produktiv aufnehmen möchte, 
ist der erste Schritt sicher die Integration von Medialität und Multimodalität 
in die linguistischen Analysen. Um aber das Postulat des Iconic Turn ernst zu 
nehmen und Bilder als Erkenntnismedien zu nutzen, ist eine diagrammatische 
Perspektive auf Sprachgebrauch ein wichtiger Schlüssel - und zwar gerade nicht 
nur im engen Sinn als Bildlichkeit verstanden, sondern als semiotisch komplexe 
Konfigurationen von Schriftlichkeit und Bildlichkeit, als transkriptive, sinninsze- 
nierende Verfahren. Ein Beispiel mag das Potenzial zeigen: 

Interessiert man sich etwa für Social Media und hegt ein diskursanalyti- 
sches Interesse an (sprachlichen / kommunikativen) Praktiken darin, zeigt sich 
die diagrammatische Perspektive als hilfreich (Bubenhofer 2019). So zeigen sich 
die Inhalte in den Interfaces von Twitter, Facebook, Instagram etc. als (teilweise 
schwach hierarchisierte) Listen, wobei mit dem Taggen eine Art Glossierung 
und Kategorisierung der Beiträge erreicht wird. Die Praktik des Taggens ist lin- 
guistisch beispielsweise interessant, da es gattungskonstitutiv wirken kann, wie 
Meier-Vieracker anhand der „Wutrede“ - öffentliche, aber spontane, emotional- 
impulsive Redebeiträge von Funktionsträgern wie Fußballtrainern — zeigte (Meier 
2016, 20). Aus diagrammatischer Perspektive zeigen sich aber verschiedene Dis- 
krepanzen zwischen der Erscheinungsform der Inhalte auf Sozialen Medien als 
Listen und den damit verbundenen menschlichen und technischen Operationen 
(Bubenhofer 2019, 125): 
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- Es sind nicht nur menschliche Annotationen, die zu Kategorisierungen, wie 
eben im Beispiel von Videobeiträgen als „Wutreden“, führen, sondern es 
handelt sich um eine Vermischung von menschlichen und algorithmischen 
Ordnungspraktiken. 

— Während die Inhalte den Nutzenden als „Streams“, also algorithmisch geord- 
neten Listen, erscheinen, verbirgt sich dahinter eine netzwerkartige Struk- 
tur als Ergebnis von Interaktionen: Nutzende können einander folgen, Texte 
sind intertextuell über die Tags verknüpft und Algorithmen gruppieren Texte 
und Nutzende nach maschinell erkannter Ähnlichkeit. Dies ermöglicht es 
den Plattformbetreibern Individuen zu profilieren und Voraussagen über 
zukünftiges Verhalten zu treffen. Die Listen und Streams verdecken die kom- 
merziell interessante diagrammatische Grundfigur des Netzwerkgraphen im 
Hintergrund. 


Diese Beobachtungen sind nicht nur diskursanalytisch interessant, sondern 
stellen auch methodologische Probleme. Sollen z.B. Daten aus Social Media 
korpuslinguistisch untersucht werden, müssen Datensätze als Samples aus den 
Datenströmen gewonnen werden. Doch welche Datenströme werden berücksich- 
tigt? Was sollte überhaupt als Text aufgefasst werden, wenn man davon ausgeht, 
dass jede Nutzerin und jeder Nutzer eine individuelle Liste von Nachrichten 
präsentiert erhält? Jede spezifische Liste als Konfiguration von annotierten und 
verschieden kategorisierbaren Minitexten stellt eine immer wieder neue Rekon- 
textualisierung dar. Die potenziellen „Listentexte“ müssten analytisch rekonstru- 
iert werden, um bei der Analyse nicht bei einer Menge von dekontextualisierten 
Einzelnachrichten stecken zu bleiben, sondern die rekontextualisierenden Kräfte 
der verschiedenen Listen sichtbar zu machen. Zudem muss analytisch entschie- 
den werden, ob die Daten eher als Listen betrachtet oder ob die netzwerkartige 
Struktur rekonstruiert werden soll. Somit ist klar, dass die Analyse selber eine 
diagrammatische Operation ist — eine Operation freilich, die nicht nur wir als 
Forschende, sondern der Plattformbetreiber selber ebenfalls macht, um die Platt- 
form kommerziell zu optimieren (Bubenhofer 2019, 131-132). 


9.4.2 Coding Cultures, Technikkulturen, Praktiken, Gender 


In Kapitel 4.4 habe ich auf die Coding Cultures, also Praktiken des Programmie- 
rens aufmerksam gemacht, die für algorithmisch erstellte Diagramme von großer 
Bedeutung sind. Gleichzeitig wissen wir um die wissenschaftlichen Denkstile, die 
sich in bestimmten wissenschaftlichen Praktiken niederschlagen und damit auch 
eine kanonische Wirkung entfalten, u.a. auch auf die diagrammatischen Mittel, 
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die in einer Disziplin zu einer bestimmten Zeit gängig sind (vgl. dazu Kapitel 3.2 
und 3.3). 

In der Diagrammatisch-Forschung spielen, so weit ich sehe, solche kulturel- 
len Aspekte jedoch noch keine große Rolle. Zwar wird z. B. aus kunsthistorischer 
Sicht mit dem Stilbegriff operiert (z. B. Bredekamp et al. 2008): Tut man das, dann 
ist es wichtig, diagrammatische Ausdrucksformen mit kulturellen Praktiken in 
Verbindungen zu bringen, wie das beispielsweise Katja Mayer macht, indem sie 
Netzwerkforschung als „visual history“ betreibt (Mayer 2011). Auch ich versuchte 
in diesem Buch an verschiedenen Stellen den Zusammenhang von kulturellen 
Praktiken, technischen Möglichkeiten und dem Gebrauch von Diagrammen in 
der Linguistik zu untersuchen. 

Es scheint mir jedoch noch einiges brach zu liegen, beispielsweise wenn ein 
Fokus auf Gender gelegt würde. Im Hinblick auf die Technikgeschichte ist bei- 
spielsweise inzwischen gut beschrieben, wie die weiblichen Programmiererin- 
nen der 1950er-Jahre langsam aus dem Feld des Programmierens verschwunden 
sind (Thompson 2019). Inzwischen, vor dem Hintergrund neuer Coding Cultures, 
müssen damit verbundene Konstruktionen von Gender sicher neu untersucht 
werden - einerseits hat der Anteil von „women in tech“ wieder zugenommen, 
andererseits muss ein eigentlicher „Gender Bias“ festgestellt werden, der sich 
beispielsweise bei der Entwicklung von Systemen Künstlicher Intelligenz drama- 
tisch auswirkt (Myers West et al. 2019). Code ist nie neutral. Wer also mit welchen 
Mitteln welche Technologien entwickelt, um - in unserem Fall - Daten zu trans- 
formieren und zu visualisieren, wirkt sich auf die Analyse der Daten aus. Bezieht 
man zusätzlich die historische Perspektive mit ein, wird die Komplexität der Kul- 
turen der Diagrammatik und Visualisierung deutlich. 

Die Geistes- und Sozialwissenschaften sind sicher ein besonders geeigneter 
Ort, um Visualisierungen nicht einfach als „Tool“ zu sehen, sondern die soziokul- 
turellen Konstruktionen, die Ensembles von Praktiken und Techniken zu Tools 
machen, zu reflektieren. 


9.4.3 Hacking und Bricolage: Ausblicke einer transsemiotischen Linguistik 


An verschiedenen Stellen habe ich auf das Prinzip des Hacking-Paradigmas, auch 
in einem abstrakten Sinn, verwiesen, mit dem herrschende Denkstile hinterfragt 
werden können. Im Kontext der Software Studies spricht Goffey (2014, 35) von 
„Bricolage“, also von Tricks und Bastellösungen während des Programmierens, 
die aber oft hinter einer Oberfläche verschwinden (vgl. Kapitel 4.4.1). Das Gehäuse 
öffnen und das Innere verändern (hacken) und zu etwas Neuem rekombinieren 
(basteln) sind Praktiken, mit denen neue Perspektiven auf Gegenstände gewon- 
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nen, manchmal aber auch neue Gegenstände überhaupt erzeugt werden. Das ist 
das Programm einer „Visuellen Linguistik“, wie in diesem Buch beschrieben ist. 

Dieses Programm kann über das Visuelle hinaus gedacht werden: Die bis- 
herigen Ausführungen haben bereits deutlich gemacht, dass ich selbst unter 
„Visueller Linguistik“ mehr verstehe, als grafische Darstellungen und dass Dia- 
grammatik über die inskribierte Fläche hinaus geht. Auch mit Jägers Konzept der 
Transkriptivität, verstanden als semiotische Medientheorie, wird die abstraktere 
Perspektive deutlich (vgl. Kapitel 3.1). Insofern stellen die im Buch gemachten 
Überlegungen auch eine Grundlage für transsemiotische und multimodale Theo- 
riebildung dar (Kress 2010; Seizov/Wildfeuer 2017). Dies wird hoffentlich auch an 
drei kleinen Beispielen unserer aktuellen Forschung deutlich: 


Digital Conversation Analysis and Feedback Table 

Im Anschluss an die Überlegungen zur Visualisierung von Gesprächen (Kapitel 
8) entstand die Idee, räumliche Interaktion und Körperlichkeit noch stärker zu 
berücksichtigen. Ausgangspunkt ist ein runder Tisch, an dem mehrere Personen 


Abb. 111: Skizze des Digital Conversation Analysis and Feedback Table (Rendering: Maaike 
Kellenberger) 
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sitzen und miteinander sprechen können. Über Mikrofone und Laryngographen 
(um zusätzlich ein besseres Signal direkt vom Kehlkopf zu haben) werden die 
Audiosignale erfasst und prozessiert. Dabei können automatisch mehrere Merk- 
male wie Stimmqualität, Intonation, Sprechgeschwindigkeit, Turnlänge etc. ana- 
lysiert werden. Mittels Spracherkennung kann der Inhalt der Gespräche in Text 
konvertiert und computerlinguistisch ausgewertet werden. Der Tisch selber stellt 
gleichzeitig eine Projektionsfläche dar, so dass Gesprächsverhalten der Teilneh- 
menden live dargestellt werden kann (vgl. Abbildung 111). Wie bereits in Kapitel 
8 dargestellt, kann durch die Visualisierung der Merkmale eine holistische Sicht 
auf die Gesprächsdynamik erzeugt werden. So kann sichtbar gemacht werden, 
wer gesprächsbeherrschend ist, welche Themen im Zentrum des Gesprächs 
stehen, was langsam an den Rand gedrängt oder gar ganz „vom Tisch fällt“. 

Der Tisch ist weit mehr als ein Analyseinstrument für Gespräche, denn die 
visualisierten Metadaten zum aktuellen Gespräch werden wiederum eine Aus- 
wirkung auf die Gesprächsteilnehmenden haben - Metareflexion wird Teil der 
Gesprächsinteraktion. Gleichzeitig bietet der Tisch auch die Möglichkeit, im 
Sinne des Iconic Turns, die Visualisierung selber zu einem Erkenntnismedium 
werden zu lassen, indem der Visualisierungsprozess auch für die Teilnehmenden 
transparent gemacht wird (wenn man so will: sie können ihn hacken): Welche 
Metaphorik leitet uns, um Gesprächsdynamiken zu beschreiben und eben auch 
analytisch sichtbar zu machen? Ausdrücke wie „vom Tisch fallen“, „auf den Tisch 
hauen“ oder ein Gespräch „am runden Tisch“ können so reflektiert werden. 


Kommunikationsräume um 1900 als VR-Erfahrung 

Im Rahmen der Promotion von Larissa Schüller zu Telefonistinnen in den Tele- 
fonzentralen vor der Umstellung auf automatische Vermittlung, erproben wir mit 
einem erweiterten Team die Möglichkeit, Virtual Reality zu nutzen, um Telefon- 
zentralen um 1900 als begehbare virtuelle Welt zu modellieren.'!” Dabei geht 
es darum eine Art re-enactment, eine „spielerische Heuristik“ (Fickers 2015) zu 
ermöglichen, um die kommunikativen Bedingungen der Berufs der Telefonistin 
nachvollziehen zu können. Die Virtual-Reality-Anwendung ist als interaktive 
Erfahrung konzipiert: Es kommen Telefonanrufe herein, die unter Beachtung 
des verlangten Protokolls abgearbeitet werden müssen, links und rechts sitzen 
weitere Telefonistinnen, die Geräuschkulisse und Atmosphäre der Zentrale kann 
damit simuliert werden. Gezielt können verschiedene Parameter, die die Arbeit 


102 Larissa Schüller leitet das Projekt, in dem Maaike Kellenberger, Christoph Hottiger, Patrick 
Jost und der Autor arbeiten. 
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wahrscheinlich beeinflussen, geändert werden: Ausgestaltung des Arbeits- 
platzes, Geräte, Typ der Telefonzentrale, Anzahl der Anrufe etc. Damit wird es 
möglich, die Arbeitssituation der Telefonistinnen auch körperlich nachvollzie- 
hen zu können und damit analysierbar zu machen. 

Einerseits ist auch dieses Projekt ein Experiment, um den Kommunikations- 
beruf der Telefonistinnen linguistisch zu analysieren. Andererseits liegt das Inte- 
resse jedoch genau so stark am Instrument der Virtual Reality selber: Es ist kein 
Konsuminstrument, kein Mittel zum Zweck, sondern Teil des Experiments, um 
herauszufinden, welche diagrammatischen Eigenschaften es mitbringt, welchen 
Denkstilen es folgt (eine VR-Brille wird primär als Konsum- und vor allem 
Gaming-Device vermarktet) und wie sich der Untersuchungsgegenstand mit den 
Möglichkeiten von VR neu konstituiert. 


Von der Visualisierung zum Interface: Goettherina 

Sehr zufällig als Spielerei ist der Gedichtautomat „Goettherina“ entstanden, ein 
Objekt ausHolz, Arduino-Bord (Einplatinen-Rechner), Servo, LEDs, Liquid Cristal 
Display, Schaltern, Thermoprinter, Lautsprecher, Tastatur, Python-Programm 


Abb. 112: Gedichtautomat „Goettherina“ (vgl. www.bubenhofer.com/visuallinguistics/ für eine 
Demo) 
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und Korpusdaten.'? Der Automat erstellt nach Eingabe eines Wortes automatisch 
ein Gedicht, wobei als Datengrundlage ein Textkorpus aus deutschsprachigen 
Gedichten der letzten Jahrhunderte und Zeitungstexten (darunter Sportartikel- 
überschriften) dient. Das Python-Programm versucht nach einem bestimmten 
Reimschema sich reimende Zeilen zu finden. Der Automat mutet Roboter-ähnlich 
an, da er (bzw. sie) spricht, die Augen bewegt, blinkt und Textausgaben auf dem 
Minidisplay erzeugen kann. Das Gedicht kann zudem auf dem Thermodrucker als 
„Kassenbeleg“ ausgegeben werden. 

Was ist nun das wissenschaftliche Interesse an Goettherina? Zunächst ist es 
sowohl linguistisch als auch literaturwissenschaftlich interessant, einen Algo- 
rithmus zu entwickeln, mit dem zufällige Gedichte erstellt werden können. Das 
automatische Erstellen von Gedichten hat dabei eine lange Tradition (Reither 
2015) und wird z.B. auch gezielt didaktisch im Gymnasialunterricht eingesetzt 
(Wampfler 2017, 141). 

Aus der Sicht einer „Visuellen Linguistik“ jedoch kommen diagrammati- 
sche und transsemiotische Aspekte hinzu: Das „Dichten“ ist ein Prozess der 
Transkription und dabei auch diagrammatischen Umordnung von Textdaten, 
allerdings in Kombination mit der Interaktion einer Person, die den Automa- 
ten in Gang setzt und beeinflusst. Die Visualisierung des Gedichtes selber, aber 
eben auch der Prozesse, die zum Gedicht führen, ist eine Mischung aus sinnlich 
wahrnehmbaren Elementen: Blinken, Augenbewegung, Drucken, Stimme. Der 
Automat operiert nicht nur digital, sondern auch physisch, indem ein Servo 
in Bewegung gesetzt wird, der die Pappe für die Augen bewegt, gedruckt und 
geblinkt wird, er funktioniert also multimedial und wirkt transsemiotisch, indem 
verschiedene Zeichensysteme miteinander interagieren. 

Mit der Programmierung, dem Basteln und der Nutzung des Automaten geht 
eine Reflexion über die verwendeten Techniken einher: Der Arduino-Computer 
bringt eine umfassende Technokultur des Hackens und Bastelns nach bestimm- 
ten Prinzipien (Open Source) mit, die synthetische, weibliche Stimme aktualisiert 
die Frage nach dem Zusammenhang von Gender, Computer und Funktion neu 
und grundsätzlich wird die Idee des Interfaces zwischen Mensch und Maschine 
problematisiert. 


Damit möchte ich die lange Reise vom „Kreis als Diagramm oder Bild“ (Abbildung 
1) beschließen. Mein Ziel lag darin, grundsätzlich über die Genese, Funktion und 
Kategorisierung von Diagrammen in der Linguistik nachzudenken. Dabei eröff- 
nete sich mir eine komplexe Welt von Visualisierung, Medialität, Digitalität und 


103 Vgl. www.bubenhofer.com/visuallinguistics/. 
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Wissensgeschichte, die nun hoffentlich nicht nur einen genaueren Blick auf Dia- 
gramme in der Linguistik ermöglicht, sondern auch zu neuen Ideen und Experi- 
menten anstiftet. 


Bibliographie 


Affolter, Katrin (2016a): Masterprojekt GeoKollokationen v2. Zürich. Abgerufen am 4. 3. 2014 
von http://www. bubenhofer.com/geocollocations/AffolterKatrin_GeoCollocations- 
Dokumentation. pdf. 

Affolter, Katrin (2016b): Visualization of Narrative Structures. Unpublished Master Thesis, 
University of Zurich. 

Allan, Keith/Hanks, Patrick (2015): Lexicography from Earliest Times to the Present. In: Oxford 
Handbooks Online. Oxford. Abgerufen am 16. 9. 2020 von https: //www.oxfordhandbooks. 
com/view/10.1093/oxfordhb/9780199585847.001.0001/oxfordhb-9780199585847-e-23. 

Andersen, Christiane/Ängsal, Magnus P./Czachur, Waldemar et al. (2018a): Erkenntnis als 
soziale Praxis. Ludwik Flecks Wissenschaftstheorie aus sprachwissenschaftlicher Sicht. 
In: Andersen, Christiane/Fix, Ulla/Schiewe, Jürgen (Hg.): Denkstile in der deutschen 
Sprachwissenschaft: Bausteine einer Fachgeschichte aus dem Blickwinkel der Wissen- 
schaftstheorie Ludwik Flecks. Berlin, 11-65. 

Andersen, Christiane/Fix, Ulla/Schiewe, Jürgen (Hg.) (2018b): Denkstile in der deutschen 
Sprachwissenschaft: Bausteine einer Fachgeschichte aus dem Blickwinkel der Wissen- 
schaftstheorie Ludwik Flecks. Berlin. 

Apel, Willi (1961): The notation of polyphonic music, 900-1600. Cambridge, MA. 

Arnauld, Antoine/Lancelot, Claude (1660): Grammaire générale et raisonn&e: contenant les 
fondements de l’art de parler... ([Reprod.]). Paris. Abgerufen am 7. 3. 2018 von http:// 
gallica.bnf.fr/ark:/12148/bpt6k50416g. 

Bachmann-Medick, Doris (2006): Cultural Turns: Neuorientierungen in den Kulturwissen- 
schaften, Rowohlts Enzyklopädie. Reinbek. 

Bafiski, Piotr (2010): Why TEI stand-off annotation doesn’t quite work: and why you might want 
to use it nevertheless. In: Balisage: The Markup Conference 2010. Montréal, Canada, doi: 
10.4242/BalisageVol5.Banski01. 

Bański, Piotr/Przepiörkowski, Adam (2010): TEI P5 as a Text Encoding Standard for Multilevel 
Corpus Annotation. In: Digital Humanities 2012: Conference Abstracts. 98-100. 

Bastian, Mathieu/Heymann, Sebastien/Jacomy, Mathieu (2009): Gephi: An Open Source 
Software for Exploring and Manipulating Networks. In: International AAAI Conference on 
Web and Social Media Third International AAAI Conference on Weblogs and Social Media. 
Abgerufen am 4. 3. 2014 von https://www.aaai.org/ocs/index.php/ICWSM/09/paper/ 
view/154/1009. 

Bauer, Matthias/Ernst, Christoph (2010): Diagrammatik. Einfiihrung in ein kultur- und medien- 
wissenschaftliches Forschungsfeld. Bielefeld. 

Belica, Cyril (2001): Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und 
Experimentierplattform fiir die Erforschung und theoretische Begriindung von systemisch- 
strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des 
Sprachgebrauchs. Abgerufen am 4. 3. 2014 von http: //corpora.ids-mannheim.de. 

Belica, Cyril/Perkuhn, Rainer (2015): 9. Feste Wortgruppen/Phraseologie I: Kollokationen und 
syntagmatische Muster. In: Haß, Ulrike/Storjohann, Petra (Hg.): Handbuch Wort und 
Wortschatz. Berlin, Boston, 201-225. doi: 10.1515/9783110296013-009. 

Bender, John B./Marrinan, Michael (2010): The Culture of Diagram. Stanford, Calif. 

Bender, John B./Marrinan, Michael (2014): Kultur des Diagramms. Berlin (Actus et imago, Band 
VIII). 


@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 
unter der Commons Attribution 4.0 Lizenz. 
https: //doi.org/10.1515/9783110698732-010 


320 —— Bibliographie 


Benzécri, Jean-Paul (1973a): L’Analyse des correspondants: introduction, théorie, applications 
diverses notamment ä l’analyse des questionnaires, programmes de calcul. Paris. 

Benzécri, Jean-Paul (1973b): L’analyse des données: leçons sur l'analyse factorielle et la 
reconnaissance des formes et travaux du laboratoire de statistique de l’Université de Paris 
VI. Paris. 

Bérard, Alexandre/Servan, Christophe/Pietquin, Olivier et al. (2016): MultiVec: a Multilingual 
and Multilevel Representation Learning Toolkit for NLP. In: The 10th edition of the 
Language Resources and Evaluation Conference (LREC 2016). 

Bergmann, Jörg (2010): Harold Garfinkel und Harvey Sacks. In: Flick, Uwe/Kardorff, Ernst von/ 
Steinke, Ines (Hg.): Qualitative Forschung: ein Handbuch. 8. Aufl. Reinbek bei Hamburg 
(Rowohlts Enzyklopädie), 51-62. 

Berry, David M. (2011): The Philosophy of Software. Basingstoke. 

Bertin, Jacques (1967): Sémiologie graphique. Les diagrammes, les réseaux, les cartes. Paris 
[u. a.]. 

Biber, Douglas/Jones, James K. (2005): Merging corpus linguistic and discourse analytic 
research goals: Discourse units in biology research articles. In: Corpus Linguistics and 
Linguistic Theory 1 (2), 151-182. 

Blatte, Andreas (2013): PolMine-Plenardebattenkorpus. Duisburg-Essen. Abgerufen am 
4.3. 2014 von http://polmine.sowi.uni-due.de/daten.html. 

Bögel, Theodor (1996): Thesaurus-Geschichten: Beiträge zu einer Historia Thesauri linguae 
Latinae von Theodor Bögel (1876-1973): Mit einem Anhang: Personenverzeichnis 
1893-1995. Herausgegeben von Dietfried Krömer und Manfred Flieger. Stuttgart. 

Bogen, Steffen/Thürlemann, Felix (2003): Jenseits der Opposition von Text und Bild: 
Überlegungen zu einer Theorie des Diagrammatischen. In: Patschovsky, Alexander 
(Hg.): Die Bildwelt der Diagramme Joachims von Fiore: Zur Medialität religiöspolitischer 
Programme im Mittelalter. Stuttgart, 1-22. 

Böhm, Gottfried (1994): Die Wiederkehr der Bilder. In: Böhm, Gottfried: Was ist ein Bild? 
München, 11-38. 

Böhm, Gottfried (2001): Zwischen Auge und Hand. Bilder als Instrumente der Erkenntnis. In: 
Heintz, Bettina/Huber, Jörg (Hg.): Mit dem Auge denken: Strategien der Sichtbarmachung 
in wissenschaftlichen und virtuellen Wellen. Zürich, Wien, New York (Theorie: Gestaltung, 
01), 43-54. 

Böhme, Gernot (2006): Technical gadgetry: technological development in the aesthetic 
economy. In: Thesis Eleven 86 (1), 54-66, doi: 10.1177/0725513606066240. 

Bohnenberger, Karl (1900): Die Mundarten von Schwenningen und Umgebung nach Karl Haag. 
In: Alemannia 28 , 138-148. 

Bolter, Jay David/Grusin, Richard (2000): Remediation: Understanding New Media. Revised. 
Cambridge, MA. 

Bostock, Michael/Ogievetsky, Vadim/Heer, Jeffrey (2011): D3: Data-Driven Documents. In: IEEE 
Trans. Visualization & Comp. Graphics (Proc. InfoVis). Abgerufen am 4. 3. 2014 von http: // 
vis.stanford.edu/papers/d3. 

Bott, Elizabeth (1957): Family and social network. London. 

Boueke, Dietrich (1995): Wie Kinder erzählen: Untersuchungen zur Erzähltheorie und zur 
Entwicklung narrativer Fähigkeiten. München. 

Bredekamp, Horst/Schneider, Birgit/Dünkel, Vera (Hg.) (2008): Das Technische Bild: 
Kompendium zu einer Stilgeschichte wissenschaftlicher Bilder. Berlin. 


Bibliographie — 321 


Brezina, Vaclav/McEnery, Tony/Wattam, Stephen (2015): Collocations in context: Anew 
perspective on collocation networks. In: International Journal of Corpus Linguistics 20 (2), 
139-173, doi: 10.1075/ijcl.20.2.01bre. 

Bubenhofer, Noah (2009): Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- 
und Kulturanalyse. Berlin, New York (Sprache und Wissen, 4). 

Bubenhofer, Noah (2013a): Quantitativ informierte qualitative Diskursanalyse. Korpus- 
linguistische Zugänge zu Einzeltexten und Serien. In: Roth, Kersten Sven/Spiegel, 
Carmen (Hg.): Angewandte Diskurslinguistik. Felder, Probleme, Perspektiven. Berlin 
(Diskursmuster - Discourse Patterns, 2), 109-134. 

Bubenhofer, Noah (2013b): Skandalisierung korpuslinguistisch. Ein empirisch-linguistischer 
Blick auf die Berichterstattung zur „Wulff-Affäre“. In: Linguistik online 4 (61), abgerufen am 
4.3. 2014 von http: //www.linguistik-online.de/61_13/bubenhofer.html. 

Bubenhofer, Noah (2014): Geokollokationen - Diskurse zu Orten: Visuelle Korpusanalyse. 

In: Sondernummer Mitteilungen des Deutschen Germanistenverbandes: Korpora in der 
Linguistik - Perspektiven und Positionen zu Daten und Datenerhebung (1), 45-59. 

Bubenhofer, Noah (2016): Drei Thesen zu Visualisierungspraktiken in den Digital Humanities. 
In: Rechtsgeschichte Legal History - Journal ofthe Max Planck Institute for European Legal 
History (24), 351-355. 

Bubenhofer, Noah (2017): Kollokationen, n-Gramme, Mehrworteinheiten. In: Roth, 

Kersten Sven/Wengeler, Martin/Ziem, Alexander (Hg.): Handbuch Sprache in Politik 
und Gesellschaft. Berlin, Boston (Handbücher Sprachwissen, 19), 69-93, doi: 
10.1515/9783110296310-004. 

Bubenhofer, Noah (20188): Diskurslinguistik und Korpora: Daten im Vektorraum. In: Warnke, 
Ingo (Hg.): Handbuch Diskurs. Berlin, Boston (Handbücher Sprachwissen, 6), 208-241. 

Bubenhofer, Noah (2018b): Serialität der Singularität: Korpusanalyse narrativer Muster in 
Geburtsberichten. In: Zeitschrift für Literaturwissenschaft und Linguistik 1-32, doi: 
10.1007/541244-018-0096-4. 

Bubenhofer, Noah (2018c): Visual Linguistics: Plädoyer für ein neues Forschungsfeld. In: 
Bubenhofer, Noah/Kupietz, Marc (Hg.): Visualisierung sprachlicher Daten. Visual 
Linguistics, Praxis, und Tools. Heidelberg, 25-62. 

Bubenhofer, Noah (2018d): Visualisierungen in der Korpuslinguistik. Diagrammatische 
Operationen zur Gegenstandkonstitution, -analyse und Ergebnispräsentation. In: Kupietz, 
Marc/Schmidt, Thomas (Hg.): Korpuslinguistik. Berlin, Boston (Germanistische Sprachwis- 
senschaft um 2020, 5), 27-60, doi: 10.1515/9783110538649-003. 

Bubenhofer, Noah (2018e): Wenn „Linguistik“ in „Korpuslinguistik“ bedeutungslos wird. Vier 
Thesen zur Zukunft der Korpuslinguistik. In: OBST. Osnabrücker Beiträge zur Sprach- 
theorie (92), 17-30. 

Bubenhofer, Noah (2019): Social Media und der Iconic Turn: Diagrammatische Ordnungen im 
Web 2.0. In: Diskurse - digital Bd. 1 (2019), 114-135. 

Bubenhofer, Noah/Dreesen, Philipp (2018): Linguistik als antifragile Disziplin? Optionen 
in der digitalen Transformation. In: Digital Classics Online 4 (1), 63-75, doi: 10.11588/ 
dco.2017.0.48493. 

Bubenhofer, Noah/Rossi, Michela (2019): Die Migrationsdiskurse in Italien und der Deutsch- 
schweiz im korpuslinguistischen Vergleich. In: Goranka, Rocco/Schafroth, Elmar (Hg.): 
Vergleichende Diskurslinguistik. Methoden und Forschungspraxis. Berlin (Kontrastive 
Linguistik, 9), 153-192. 


322 —— Bibliographie 


Bubenhofer, Noah/Scharloth, Joachim (2011): Korpuspragmatische Analysen alpinistischer 
Literatur. In: Elmiger, Daniel/Kamber, Alain (Hg.): La linguistique de corpus - de l’analyse 
quantitative a l’interpretation qualitative / Korpuslinguistik - von der quantitativen 
Analyse zur qualitativen Interpretatino. Neuchätel (Travaux neuchätelois de linguistique, 
55), 241-259. 

Bubenhofer, Noah/Scharloth, Joachim (2015): Maschinelle Textanalyse im Zeichen von Big 
Data und Data-driven Turn — Überblick und Desiderate. In: Zeitschrift für Germanistische 
Linguistik 43 (1), 1-26. 

Bubenhofer, Noah/ Müller, Nicole/Scharloth, Joachim (2013): Narrative Muster und Diskurs- 
analyse: Ein datengeleiteter Ansatz. In: Zeitschrift für Semiotik, Methoden der 
Diskursanalyse 35 (3-4), 419-444. 

Bubenhofer, Noah/Scharloth, Joachim/Eugster, David (2015a): Rhizome digital: Datengeleitete 
Methoden für alte und neue Fragestellungen in der Diskursanalyse. In: Zeitschrift für 
Diskursforschung, Sonderheft Diskurs, Interpretation, Hermeneutik1, 144-172. 

Bubenhofer, Noah/Volk, Martin/Leuenberger, Fabienne et al. (Hg.) (2015b): Text+Berg-Korpus 
(Release 151_v01). Abgerufen am 4. 3. 2014 von http: //www.textberg.ch. 

Bubenhofer, Noah/Rothenhäusler, Klaus/Affolter, Katrin et al. (2019): The Linguistic 
Construction of World - an Example of Visual Analysis and Methodological Challenges. 
In: Scholz, Ronny (Hg.): Quantifying Approaches to Discourse for Social Scientists. 
Basingstoke, 251-284, doi: 10.1007/978-3-319-97370-8_9. 

Bühler, Karl (1934): Sprachtheorie. Stuttgart. 

Burri, Regula (2001): Doing Images. Zur soziotechnischen Fabrikation visueller Erkenntnis in 
der Medizin. In: Heintz, Bettina/Huber, Jörg (Hg.): Mit dem Auge denken: Strategien der 
Sichtbarmachung in wissenschaftlichen und virtuellen Wellen. Zürich, Wien, New York 
(Theorie: Gestaltung, 01), 277-304. 

Busa, Roberto (1951): Sancti Thomae Aquinatis Hymnorum ritualium varia specimina 
concordantiarum: primo saggio di indici di parole automaticamente composti e stampi da 
macchine IBM a schede perforate = A 1st example of word index automatically compiled 
and printed by IBM punched card machines. Milano (Archivum philosophicum Aloisianum. 
Serie 2). 

Bush, Vannevar (1945): As We May Think. In: Life, 10 September 1945, 112-124. 

Busse, Dietrich/Hermanns, Fritz/Teubert, Wolfgang (Hg.) (1994): Begriffsgeschichte und 
Diskursgeschichte. Methodenfragen und Forschungsergebnisse der historischen 
Semantik. Opladen. 

Castells, Manuel (1996): The Information Age: Economy, Society, and Culture. The rise ofthe 
network society. Malden, MA. 

Castells, Manuel (1997): The Information Age: Economy, Society, and Culture. The power of 
identity. Malden, MA. 

Castells, Manuel (1998): The Information Age: Economy, Society, and Culture. End of 
Millennium. Oxford. 

Chen, Chun-houh/Härdle, Wolfgang/Unwin, Antony (Hg.) (2008): Handbook of data 
visualization. Berlin, Heidelberg (Springer handbooks of computational statistics). 

Chomsky, Noam (1965): Aspects ofthe theory of syntax. Cambridge, MA. 

Coleman, E. Gabriella (2012): Coding Freedom: The Ethics and Aesthetics of Hacking. Princeton, 
Oxford. 


Bibliographie — 323 


Colloseus, Cecilia (2016): Gebären - Erzählen. Kulturanthropologische und interdisziplinäre 
Perspektiven auf die Geburt als leibkörperliche Grenzerfahrung. (Inauguraldissertation) 
Mainz. 

Cruse, David A. (1986): Lexical semantics. Cambridge, MA. 

Deleuze, Gilles/Guattari, Felix (1993): Tausend Plateaus: Kapitalismus und Schizophrenie / 
Kapitalismus und Schizophrenie. Berlin. 

Deppermann, Arnulf (2008): Gespräche analysieren: Eine Einführung. 4. Aufl. Wiesbaden 
(Qualitative Sozialforschung, 3). 

Deppermann, Arnulf (2015): Pragmatik revisited. In: Eichinger, Ludwig M. (Hg.): Sprachwis- 
senschaft im Fokus Positionsbestimmungen und Perspektiven. Berlin, Boston, 323-352, 
doi: 10.1515/9783110401592.323. 

Diderot, Denis/d’Alembert, Jean Le Rond (1751): Encyclopédie, ou dictionnaire raisonné des 
sciences, des arts et des métiers. Paris. 

Diekmann, Andreas (1998): Empirische Sozialforschung. Grundlagen, Methoden, 
Anwendungen. 4. Aufl. Reinbek bei Hamburg. 

Dill, John/Earnshaw, Rae/Kasik, David/Vince, John/Wong, Pak Chung (Hg.) (2012): Expanding 
the Frontiers of Visual Analytics and Visualization. London. 

Dorling, D. (1993): Map design for census mapping. In: The Cartographic Journal 30 (2), 
167-183, doi: 10.1179/000870493787860175. 

Dornseiff, Franz (2004): Der deutsche Wortschatz nach Sachgruppen. Berlin, New York. 

Dourish, Paul (2014): No SQL: The Shifting Materialities of Database Technology: Computational 
Culture. In: Computational Culture. A Journal of Software Studies (4), abgerufen am 
20. 8. 2015 von http://computationalculture.net/article/no-sql-the-shifting-materialities- 
of-database-technology. 

Drucker, Johanna (2008): Graphical Approaches to the Digital Humanities. In: Schreibman, 
Susan/Siemens, Ray/Unsworth, John (Hg.): A Companion to Digital Humanities. Malden, 
MA, 238-250. 

Dunning, Ted E. (1993): Accurate Methods for the Statistics of Surprise and Coincidence. In: 
Computational Linguistics 19 (1), 61-74. 

Diirscheid, Christa (2012): Syntax: Grundlagen und Theorien. Gottingen. 

Echterhölter, Anna (2015): Jack Goody: Die Liste als Praktik. In: Deicher, Susanne/Weber, Anke 
(Hg.): Die Liste: Ordnungen von Dingen und Menschen in Agypten. Berlin (Ancient Egyptian 
design, contemporary design history and anthropology of design), 243-261. 

Eco, Umberto (1977): Zeichen. Einfiihrung in einen Begriff und seine Geschichte. Frankfurt am 
Main (es, 895). 

Eco, Umberto (2002): Einführung in die Semiotik. 9. Aufl. München. 

Eco, Umberto (2009): Die unendliche Liste. Miinchen. 

Ehlich, Konrad (Hg.) (1980): Erzählen im Alltag. Frankfurt am Main (Suhrkamp-Taschenbuch 
Wissenschaft). 

Ehlich, Konrad (2007a): Erzählraum Schule - Ein kleines Plädoyer für eine alltägliche 
Kunst. In: Sprache und sprachliches Handeln. Berlin, New York, 423-426, doi: 
10.1515/9783110922721.3.423. 

Ehlich, Konrad (2007b): Sind Bilder Texte? In: Sprache und sprachliches Handeln. Berlin, New 
York, 603-618, doi: 10.1515/9783110922721.3.603. 

Ehlich, Konrad/Rehbein, Jochen (1976): Halbinterpretative Arbeitstranskriptionen (HIAT). In: 
Linguistische Berichte 45 , 21-41. 


324 —— Bibliographie 


Ehlich, Konrad/Rehbein, Jochen (1979): Erweiterte halbinterpretative Arbeitstranskriptionen 
(HIAT2): Intonation. In: Linguistische Berichte (59), 51-75. 

Engelbart, Doublas C. (1992): Letter to Vannevar Bush and Program On Human Effectiveness. 
In: Nyce, James M./Kahn, Paul (Hg.): From Memex to Hypertext: Vannevar Bush and the 
Mind’s Machine. San Diego, CA, 235-236. 

Engelbart, Doublas C./English, William K. (1968): A Research Center for Augmenting Human 
Intellect. In: AFIPS Conference Proceedings of the 1968 Fall Joint Computer Conference. 
San Francisco, 395-410. 

Evert, Stefan (2009): 58. corpora and collocations. In: Lüdeling, Anke/Kytö, Merja (Hg.): Corpus 
Linguistics. Berlin, New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 
29), 1212-1248. 

Evert, Stefan/The OCWB Development Team (2010): The IMS Open Corpus Workbench (CWB). 
CQP Query Language Tutorial. Abgerufen am 4. 3. 2014 von http://cwb.sourceforge.net/ 
files/CQP_Tutorial/. 

Faruqui, Manaal/Pad6, Sebastian (2010): Training and Evaluating a German Named Entity 
Recognizer with Semantic Generalization. In: Proceedings of KONVENS 2010. Saarbriicken, 
Germany, 129-134. 

Feilke, Helmuth (2000): Die pragmatische Wende in der Textlinguistik. In: Brinker, Klaus (Hg.): 
Text- und Gesprächslinguistik/Linguistics of Text and Conversation. Berlin, New York 
(Handbiicher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and 
Communication Science, 16), 64-82. 

Feilke, Helmut/Linke, Angelika (Hg.) (2009): Oberfläche und Performanz. Untersuchungen zur 
Sprache als dynamische Gestalt. Berlin, New York. 

Feinberg, Jonathan (2010): Wordle. In: Steele, Julie/Iliinsky, Noah (Hg.): Beautiful Visualization: 
Looking at Data through the Eyes of Experts. Sebastopol, CA, 37-58. 

Felder, Ekkehard/Müller, Marcus/Vogel, Friedemann (2011): Korpuspragmatik: Thematische 
Korpora als Basis diskurslinguistischer Analysen. Berlin, New York. 

Fellbaum, Christiane (2001): Theories of semantic representation of the mental lexicon. In: 
Cruse, D. Alan/Hundsnurscher, Franz/Job, Michael/Lutzeier, Peter Wolf (Hg.): Lexikologie. 
Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. 
Berlin, New York, 943-1944, doi: 10.1515/9783110171471.2.39.1749. 

Fickers, Andreas (2015): Hands-on! Plädoyer für eine experimentelle Medienarchäologie. In: 
Technikgeschichte Bd. 2 (2015), Nr. 82, 67-85. 

Finkel, Jenny Rose/Grenager, Trond/Manning, Christopher (2005): Incorporating Non-Local 
Information into Information Extraction Systems by Gibbs Sampling. In: ACL. 363-370. 

Firth, John Rupert (1957): Modes of Meaning. In: Papers in Linguistics 1934-1951. London, 
190-215. 

Fisher, Danyel (2010): Animation for Visualization: Opportunities and Drawbacks. In: Steele, 
Julie/lliinsky, Noah (Hg.): Beautiful Visualization: Looking at Data through the Eyes of 
Experts. Sebastopol, CA, 329-352. 

Fix, Ulla (2011): Denkstile und Sprache. Die Funktion von „Sinn-Sehen“ und „Sinn-Bildern“ für 
die „Entwicklung einer wissenschaftlichen Tatsache“. Abgerufen am 31. 3. 2016 von http:// 
home.uni-leipzig.de/fix/Fleck.pdf. 

Fleck, Ludwik (1980): Entstehung und Entwicklung einer wissenschaftlichen Tatsache: 
Einführung in die Lehre vom Denkstil und Denkkollektiv. 10. Aufl. Herausgegeben von 
Lothar Schäfer und Thomas Schnelle. Frankfurt am Main. 


Bibliographie — 325 


Fleck, Ludwik (1983): Erfahrung und Tatsache: gesammelte Aufsätze. Herausgegeben von 
Lothar Schäfer und Thomas Schnelle. Frankfurt am Main. 

Fleck, Ludwik (2011): Denkstile und Tatsachen: Gesammelte Schriften und Zeugnisse. Heraus- 
gegeben von Sylwia Werner und Claus Zittel. Berlin. 

Fönagy, Ivan/Magdics, Klara (1963): Emotional Patterns in Intonation and Music. In: STUF. 
Language Typology and Universals 16 (1-4), doi: 10.1524 /stuf.1963.16.14.293. 

Ford, Paul (2015): What Is Code? If You Don’t Know, You Need to Read This. In: Businessweek, 
abgerufen am 8.7. 2015 von http://www.bloomberg.com/whatiscode/. 

Friendly, Michael (2008): A Brief History of Data Visualization. In: Chen, Chun-houh/Härdle, 
Wolfgang/Unwin, Antony (Hg.): Handbook of data visualization. (Springer handbooks of 
computational statistics), 15-56. 

Fry, Ben (2008): Visualizing Data: Exploring and Explaining Data with the Processing 
Environment. Sebastopol, CA. 

Fuller, Matthew (2003): Behind the blip: essays on the culture of software. New York. 

Fuller, Matthew (Hg.) (2008): Software Studies: A Lexicon. Cambridge. 

Gardt, Andreas (2012): Geschichte der Sprachwissenschaft in Deutschland. Vom Mittelalter bis 
ins 20. Jahrhundert. Berlin, Boston. 

Garrett, Jesse James (2008): Ajax: A New Approach to Web Applications. Abgerufen am 
16. 9. 2020 von https://web.archive.org/web/20080702075113/http://www.adaptivepath. 
com/ideas/essays/archives/000385.php. 

Gennadius, Massiliensis (775): St. Gallen, Stiftsbibliothek, Cod. Sang. 911: Abrogans. 
Vocabularius (Keronis) et Alia. doi: 10.5076/e-codices-csg-0911. 

Glasze, Georg (2009): Kritische Kartographie. In: Geographische Zeitschrift 97 (4), 181-191. 

Goebl, Hans (1994): Dialektometrie und Dialektgeographie. Ergebnisse und Desiderata. In: 
Mattheier, Klaus J./Wiesinger, Peter (Hg.): Dialektologie des Deutschen: Forschungsstand 
und Entwicklungstendenzen. Tübingen (Reihe Germanistische Linguistik), 171-192. 

Goffey, Andrew (2014): Technology, Logistics and Logic: Rethinking the Problem of Fun in 
Software. In: Goriunova, Olga (Hg.): Fun and Software: Exploring Pleasure, Paradox, and 
Pain in Computing. New York, 21-40. 

Goodman, Nelson/Elgin, Catherine Z. (1989): Revisionen: Philosophie und andere Künste und 
Wissenschaften. 

Goody, Jack (1977): The Domestication ofthe Savage Mind. Cambridge, MA. 

Görg, Carsten/Liu, Zhicheng/Stasko, John (2014): Reflections on the Evolution ofthe 
Jigsaw Visual Analytics System. In: Information Visualization 13 (4), 336-345, doi: 
10.1177/1473871613495674. 

Grimm, Jacob/Grimm, Wilhelm (1854): Deutsches Wörterbuch von Jacob und Wilhelm Grimm. 
Leipzig. 

Gugerli, David/Orland, Barbara (2002): Einführung. In: Gugerli, David/Orland, Barbara (Hg.): 
Ganz normale Bilder: Historische Beiträge zur visuellen Herstellung von Selbstverständ- 
lichkeit, 9-17, doi: 10.3929 /ethz-a-004374140. 

Gülich, Elisabeth (1980): Konventionelle Muster und kommunikative Funktionen von Alltags- 
erzählungen. In: Erzählen im Alltag. Frankfurt am Main (Suhrkamp-Taschenbuch 
Wissenschaft), 335-384. 

Haag, Karl (1898): Die Mundarten des oberen Neckar- und Donaulandes (Schwäbisch-aleman- 
nisches Grenzgebiet: Baarmundarten) mit karte. Reutlingen Abgerufen am 19. 1. 2018 von 
https://catalog.hathitrust.org/Record/100639773. 


326 —— Bibliographie 


Haag, Karl (1901): Ueber Mundartengeographie. In: Zeitschrift der Gesellschaft für Beförderung 
der Geschichts-, Altertums- und Volkskunde von Freiburg, dem Breisgau und den 
angrenzenden Landschaften 17, 228-247. 

Habscheid, Stephan (2016): Handeln in Praxis. Hinter- und Untergründe situierter sprachlicher 
Bedeutungskonstitution. In: Deppermann, Arnulf/Feilke, Helmuth/Linke, Angelika (Hg.): 
Sprachliche und kommunikative Praktiken. Berlin, Boston. 

Halliday, Josh (2011): Internet Users Get Animated about RSA Short Film Series. The 
Guardian. 21.10. 2011, abgerufen am 2. 11. 2017 von http: //www.theguardian.com/ 
artanddesign/2011/oct/21/internet-users-animated-rsa-films. 

Harleman Stewart, Ann (1976): Graphic Representation of Models in Linguistic Theory. 
Bloomington, London. 

Hartigan, J. A./Kleiner, B. (1981): Mosaics for Contingency Tables. In: Computer Science 
and Statistics: Proceedings of the 13th Symposium on the Interface. 268-273, doi: 
10.1007/978-1-4613-9464-8_37. 

Haß, Ulrike (2005): Das Drama des Sehens: Auge, Blick und Bühnenform. München. 

Haß, Ulrike/Storjohann, Petra (Hg.) (2015): Handbuch Wort und Wortschatz. Berlin, Boston. 

Haß-Zumkehr, Ulrike (2012): Deutsche Wörterbücher. Brennpunkt von Sprach- und Kulturge- 
schichte. Berlin, Boston, doi: 10.1515/9783110849189. 

Häußling, Roger (2010): Zur Verankerung der Netzwerkforschung in einem methodologischen 
Relationalismus. In: Stegbauer, Christian (Hg.): Netzwerkanalyse und Netzwerktheorie. 
Wiesbaden, 65-78. 

Heeringa, Wilbert Jan (2004): Measuring Dialect Pronunciation Differences using Levenshtein 
Distance. Groningen (Groningen Dissertations in Linguistics, 46), abgerufen am 4. 3. 2014 
von https: //www.rug.nl/research/portal/files/9800656/thesis. pdf. 

Heilmann, Till A. (2012): Textverarbeitung. Eine Mediengeschichte des Computers als Schreib- 
maschine. Bielefeld (MedienAnalysen, 10). 

Heintz, Bettina/Huber, Jörg (2001): Der verführerische Blick. Formen und Folgen wissen- 
schaftlicher Visualisierungsstrategien. In: Heintz, Bettina/Huber, Jörg (Hg.): Mit dem Auge 
denken: Strategien der Sichtbarmachung in wissenschaftlichen und virtuellen Wellen. 
Zürich, Wien, New York (Theorie: Gestaltung, 01), 9-42. 

Heringer, Hans Jürgen (1993): Basic Ideas and the Classical Model. In: Syntax. Berlin, Boston 
(Handbücher zur Sprach- und Kommunikationswissenschaft), 298-316. 

Hermanns, Fritz (1994): Schlüssel-, Schlag- und Fahnenwörter. Zu Begrifflichkeit und Theorie 
der lexikalischen „politischen Semantik“. Mannheim (Arbeiten aus dem Sonderfor- 
schungsbereich 245, 81). 

Hoger «von Werden>/Hucbaldus <de Sanco Amando>/Isidorus <Hispalensis> (1000): Scolica 
enchiriadis de arte musica u. a. musiktheoretische Texte. Werden (?), abgerufen am 
4.3. 2014 von http://bsbsbb.bsb.Irz.de/~db/0000/sbb00000078/images/. 

Hoppenkamps, Hermann (1977): Information oder Manipulation? Untersuchungen zur Zeitungs- 
berichterstattung tiber eine Debatte des Deutschen Bundestages. Tiibingen. 

Humboldt, Wilhelm Freiherr von (1838): Uber die Kawi-Sprache auf der Insel Java: nebst einer 
Einleitung über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluss auf 
die geistige Entwickelung des Menschengeschlechts. Berlin. 

Isidorus, Hispalensis/Hieronymus, Sophronius Eusebius (775): St. Gallen, Stiftsbibliothek, Cod. 
Sang. 913 : Vocabularius S. Galli. doi: 10.5076/e-codices-csg-0913. 

Jäger, Ludwig (2004): Störung und Transparenz. Skizze zur performativen Logik des Medialen. 
In: Krämer, Sybille (Hg.): Performativität und Medialität. München, 35-73. 


Bibliographie —— 327 


Jager, Ludwig (2005): Vom Eigensinn des Mediums Sprache. In: Busse, Dietrich/Niehr, Thomas/ 
Wengeler, Martin (Hg.): Brisante Semantik. Neuere Konzepte und Forschungsergebnisse 
einer kulturwissenschaftlichen Linguistik. Tübingen (Reihe Germanistische Linguistik), 
45-64. 

Jäger, Ludwig (2007): Transkriptive Verhältnisse. Zur Logik intra- und intermedialer 
Bezugnahmen in ästhetischen Diskursen. In: Buschmeier, Gabriele/Konrad, Ulrich/ 
Riethmüller, Albrecht (Hg.): Transkription und Fassung. Bericht des Kolloquiums Mainz 
2004. Mainz. 

Jäger, Ludwig (2010): Intermedialität - Intramedialität - Transkriptivität. Überlegungen zu 
einigen Prinzipien der kulturellen Semiosis. In: Deppermann, Arnulf/Linke, Angelika (Hg.): 
Sprache intermedial: Stimme und Schrift, Bild und Ton. Berlin, 301-324. 

Jänicke, Stefan/Franzini, Greta/Cheema, Muhammad Faisal et al. (2016): Visual text analysis in 
digital humanities. In: Computer Graphics Forum 1-25, doi: 10.1111/cgf.12873. 

Jannidis, Fotis/Kohle, Hubertus/Rehbein, Malte (Hg.) (2017): Digital Humanities: eine 
Einführung. Stuttgart. 

Joseph, John E. (2017): The arbre-tree sign: Pictures and Words in Counterpoint in the Cours de 
Linguistique Générale. In: Semiotica 2017 (217), 147-171, doi: 10.1515/sem-2016-0040. 

Jullien, François (Hg.) (2004): Die Kunst, Listen zu erstellen. Berlin. 

Kalwa, Nina (2018): Vom Sediment an die Oberfläche. Die Manifestation von Denkstilen in der 
wissenschaftlichen Kontroverse. In: Andersen, Christiane/Fix, Ulla/Schiewe, Jiirgen (Hg.): 
Denkstile in der deutschen Sprachwissenschaft. Tübingen. 

Kath, Roxana/Schaal, Gary S./Dumm, Sebastian (2015): New Visual Hermeneutics. In: 
Zeitschrift für germanistische Linguistik 43 (1), 27-51. 

Kay, Alan/Goldberg, Adele (1977): Personal Dynamic Media. In: Computer 10 (3), 31-41, doi: 
10.1109/C-M.1977.217672. 

Keibel, Holger/Belica, Cyril (2007): CCDB: A Corpus-Linguistic Research and Development 
Workbench. In: Proceedings of the 4th Corpus Linguistics Conference. Birmingham. 

Keim, Daniel A./Mansmann, Florian/Schneidewind, Jörn/Thomas, Jim/Ziegler, Hartmut (2008): 
Visual Analytics: Scope and Challenges. In: Simoff, Simeon J./Böhlen, Michael H./ 
Mazeika, Arturas (Hg.): Visual Data Mining, Lecture Notes in Computer Science. Berlin, 
76-90. 

Keim, Daniel A./Kohlhammer, Jörn/Ellis, Geoffrey et al. (2010): Mastering the Information Age. 
Solving Problems with Visual Analytics. Goslar. 

Keller, Rudi (1995): Zeichentheorie. Zu einer Theorie semiotischen Wissens. Tiibingen. 

Kim, Sung-Do (2008): La raison graphique de Saussure. In: Cahiers Ferdinand de Saussure (61), 
23-42. 

Kittler, Friedrich (1989): Die kiinstliche Intelligenz des Weltkriegs: Alan Turing. In: Kittler, 
Friedrich/Tholen, Georg Christoph (Hg.): Arsenale der Seele. Literatur- und Medienanalyse 
seit 1870. München, 187-202. 

Kittler, Friedrich (1993): Draculas Vermächtnis. Technische Schriften. Leipzig. 

Klaproth, Heinrich Julius (1823): Asia polyglotta. Paris. Abgerufen am 4.3. 2014 von http:// 
opacplus.bsb-muenchen.de/title/BV001500075/ft/bsb10691043?page=1. 

Knapp, Werner (1997): Schriftliches Erzählen in der Zweitsprache. Tübingen. Abgerufen am 
6.9. 2017 von https: //www.degruyter.com/viewbooktoc/product/159450. 

Knorr Cetina, Karin (2009): „Viskurse“ der Physik. Konsensbildung und visuelle Darstellung. In: 
Heintz, Bettina/Huber, Jörg (Hg.): Mit dem Auge denken: Strategien der Sichtbarmachung 


328 —— Bibliographie 


in wissenschaftlichen und virtuellen Wellen. Zürich, Wien, New York (Theorie: Gestaltung, 
1), 305-320. 

Knuth, Donald Ervin (1998): Sorting and Searching. 2. Aufl. Reading, MA (The Art of Computer 
Programming). 

Knuth, Donald Ervin (2011): The Art of Computer Programming. Amsterdam. 

König, Werner (1978): Dtv-Atlas zur deutschen Sprache: Tafeln und Texte. München. 

Krämer, Sybille (2009): Operative Bildlichkeit. Von der ‚Grammatologie‘ zu einer ‚Diagramm- 
atologie‘? In: Heßler, Martina/Mersch, Dieter (Hg.): Logik des Bildlichen. Zur Kritik der 
ikonischen Vernunft. Bielefeld (Metabasis, 2), 94-123. 

Krämer, Sybille (2012): Was ist eigentlich eine Karte? Wie Karten Räume darstellen und warum 
Ptolemaios zur Gründerfigur wissenschaftlicher Kartografie wird. In: Dally, Ortwin/ 

Fless, Friederike/Haensch, Rudolf et al. (Hg.): Politische Räume in vormodernen Gesell- 
schaften. Gestaltung - Wahrnehmung - Funktion. Internationale Tagung des DAI und des 
DFG-Exzellenzclusters TOPOI vom 18.-22. November 2009 in Berlin. Rahden/Westf. 

Krämer, Sybille (2016): Figuration, Anschauung, Erkenntnis: Grundlinien einer Diagramm- 
atologie. Frankfurt am Main. 

Kress, Gunther (2010): Multimodality: A Social Semiotic Approach to Contemporary 
Communication. London, New York. 

Kruja, Eriola/Marks, Joe/Blair, Ann et al. (2002): A Short Note on the History of Graph Drawing. 
In: Mutzel, Petra/Jünger, Michael/Leipert, Sebastian (Hg.): Graph Drawing. (Lecture Notes 
in Computer Science, 2265), 272-286. 

Kucher, Kostiantyn/Kerren, Andreas (2015): Text Visualization Techniques: Taxonomy, 

Visual Survey, and Community Insights. In: 2015 IEEE Pacific Visualization Symposium. 
Hangzhou, 117-121, doi: 10.1109 /PACIFICVIS.2015.7156366. 

Labov, William/Waletzky, Joshua (1973): Erzählanalyse. Mündliche Versionen persönlicher 
Erfahrung. In: Ihwe, Jens (Hg.): Literaturwissenschaft und Linguistik. Frankfurt am Main 
(Eine Auswahl Texte zur Theorie der Literaturwissenschaft), 78-126. 

Lauersdorf, Mark Richard (2018): Linguistic visualizations as objets d’art? In: Bubenhofer, 
Noah/Kupietz, Marc (Hg.): Visualisierung sprachlicher Daten. Visual Linguistics, Praxis, 
und Tools. Heidelberg, 91-122. 

Lemke, Matthias/Wiedemann, Gregor (Hg.) (2016): Text Mining in den Sozialwissenschaften: 
Grundlagen und Anwendungen zwischen qualitativer und quantitativer Diskursanalyse. 
Wiesbaden. 

Lemnitzer, Lothar/Zinsmeister, Heike (2006): Korpuslinguistik. Eine Einführung. Tübingen. 

Levy, Pierre (1998): Die Erfindung des Computers. In: Serres, Michel (Hg.): Elemente einer 
Geschichte der Wissenschaften. 2. Aufl. Frankfurt am Main, 905-944. 

Levy, Steven (2010): Hackers: Heroes ofthe Computer Revolution. Sebastopol, CA. 

Li, Ming (2006): Chinese Lexicography. In: Encyclopedia of Language & Linguistics (Second 
Edition). Oxford, 362-365, doi: 10.1016/B0-08-044854-2/04692-7. 

Lima, Manuel (2014): The Book of Trees: Visualizing Branches of Knowledge. New York. 

Lima, Manuel (2015): A Visual History of Human Knowledge. Abgerufen am 6. 2. 2018 von 
https: //www.ted.com/talks/manuel_lima_a_visual_history_of_human_knowledge. 

Linke, Angelika (2003): Sprachgeschichte - Gesellschaftsgeschichte - Kulturanalyse. In: 
Henne, Helmut/Sitta, Horst/Wiegand, Herbert Ernst (Hg.): Germanistische Linguistik: 
Konturen eines Faches. Tübingen, 25-65. 

Lobin, Henning (2014): Engelbarts Traum: Wie der Computer uns Lesen und Schreiben abnimmt. 
Frankfurt. 


Bibliographie —— 329 


Luong, Minh-Thang/Pham, Hieu/Manning, Christopher D. (2015): Bilingual Word Represen- 
tations with Monolingual Quality in Mind. In: NAACL Workshop on Vector Space Modeling 
for NLP. Denver, United States. 

Lüthy, Christoph/Smets, Alexis (2009): Words, Lines, Diagrams, Images: Towards a 
History of Scientific Imagery. In: Early Science and Medicine 14 (1), 398-439, doi: 

10.1163 /157338209X425632. 

Lutzeier, Peter Rolf (1981): Wort und Feld, wortsemantische Fragestellungen mit besonderer 
Berücksichtigung des Wortfeldbegriffes. Tübingen. 

Lyons, John (1968): Introduction to Theoretical Linguistics. Cambridge, MA. 

Lyons, John (1977): Semantics. Cambridge, MA. 

Lyons, John (1991): Bedeutungstheorien. In: Stechow, Arnim von/Wunderlich, Dieter (Hg.): 
Semantik. Berlin, New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 
6), doi: 10.1515/9783110126969.1.1. 

Macha, Jiirgen (2005): Entwicklungen und Perspektiven in der Dialektologie des Deutschen: 
Einige Schlaglichter. In: Linguistik online 3 (05), abgerufen am 4. 3. 2014 von http:// 
linguistik-online.ch/24_05/macha.pdf. 

Mackenzie, Adrian (2006): Cutting Code: Software And Sociality (Digital Formations). New York, 
Washington. 

Mahmid Ibn-al-Husain al-KaSgari (2007): Divänü lugäti’t-Türk = Kitab diwän lugat at-Turk. 
Herausgegeben von Serap Tuba Yurteser und Seckin Erdi. istanbul. 

Manovich, Lev (2002): The Language of New Media. Cambridge, MA. 

Manovich, Lev (2013): Software Takes Command. New York, London. 

Manovich, Lev (2015): Data Science and Computational Art History. In: International Journal for 
Digital Art History (1), 12-24. 

Mayer, Katja (2011): Imag(in)ing Social Networks. Zur epistemischen Praxis der Visualisierung 
Sozialer Netzwerke. (Dissertation) Wien. 

Meier, Simon (2016): Wutreden - Konstruktion einer Gattung in den digitalen Medien. In: 
Zeitschrift für germanistische Linguistik Bd. 44 (2016), Nr. 1, 37-68. 

Mikolov, Tomas/Chen, Kai/Corrado, Greg et al. (2013): Efficient Estimation of Word Represen- 
tations in Vector Space. In: arXiv:1301.3781, abgerufen am 14. 4. 2016 von http://arxiv.org/ 
abs/1301.3781. 

Miller, George A. (1990): Nouns in Wordnet: A Lexical Inheritance System. In: International 
Journal of Lexicography 3 (4), 245-264, doi: 10.1093/ijl/3.4.245. 

Miller, George A./Beckwith, Richard/Fellbaum, Christiane et al. (1990): Introduction to 
Wordnet: An On-Line Lexical Database. In: International Journal of Lexicography 3 (4), 
235-244, doi: 10.1093/ijl/3.4.235. 

Mitchell, William J. Thomas/Frank, Gustav (Hg.) (2013): Bildtheorie. 6. Aufl. Frankfurt am Main. 

Moreno, Jacob Levy (1934): Who Shall Survive: A New Approach to the Problem of Human 
Interrelations. Washington, D.C. Abgerufen am 7. 2. 2018 von http://archive.org/details/ 
whoshallsurvivenOOjlmo. 

Moretti, Franco (2000): Conjectures on World Literature. In: New Left Review (1), 54-68. 

Moretti, Franco (2009): Kurven, Karten, Stammbäume. Abstrakte Modelle für die Literaturge- 
schichte. Frankfurt am Main (edition suhrkamp, 2564). 

Morris, Charles William (1938): Grundlagen der Zeichentheorie. Ästhetik der Zeichentheorie. 
München. 

Morris, Derrick/Tamm, Boris (Hg.) (1993): Concise encyclopedia of software engineering. 


330 —— Bibliographie 


Mühlhäusler, Peter (2010): 17. Mapping linguistic typology. In: Language and Space. An 
International Handbook of Linguistic Variation. Berlin, New York, 355-374. 

Müller, Stefan (2013): Grammatiktheorie. 2. Aufl. Tübingen. 

Myers West, Sarah/Whittaker, Meredith/Crawford, Kate (2019): Discriminating Systems. 
Gender, Race, and Power in Al. New York. 

Nagl, Ludwig (1992): Charles Sanders Peirce. Frankfurt, New York. 

Niehr, Thomas (2015): Die Universität im öffentlichen Sprachgebrauch. Ein Plädoyer für das 
Zusammenwirken von quantitativen und qualitativen Methoden der Diskursforschung. In: 
Roth, Kersten Sven/Schiewe, Jürgen (Hg.): Sprache, Universität, Öffentlichkeit: Festschrift 
für Jürgen Schiewe. Bremen, 134-146. 

Norris, Sigrid (2004): Analyzing Multimodal Interaction: A Methodological Framework. 
Abingdon-on-Thames. 

Ogden, Charles Kay/Richards, Ivor Armstrong (1923): The Meaning of Meaning: A Study ofthe 
Influence of Language Upon Thought and ofthe Science of Symbolism. New York. 

O’Neil, Cathy (2016): Weapons of Math Destruction: How Big Data Increases Inequality and 
Threatens Democracy. New York. 

Peirce, Charles S; Hartshorne, Charles/Weiss, Paul/Burks, Arthur W (Hg.) (1994a): Elements Of 
Logic. Charlottesville, VA. (The collected papers of Charles Sanders Peirce), abgerufen am 
14.1. 2016 von http: //www.nIx.com/collections/95. 

Peirce, Charles S; Hartshorne, Charles/Weiss, Paul/Burks, Arthur W (Hg.) (1994b): Principles 
of Philosophy. Charlottesville, VA. (The collected papers of Charles Sanders Peirce), 
abgerufen am 14. 1. 2016 von http: //www.nlx.com/collections/95. 

Perkuhn, Rainer/Keibel, Holger/Kupietz, Marc (2012): Korpuslinguistik. Stuttgart. 

Pfeffer, Jürgen (2010): Visualisierung sozialer Netzwerke. In: Stegbauer, Christian (Hg.): 
Netzwerkanalyse und Netzwerktheorie. Wiesbaden, 227-238. 

Pörksen, Uwe (1997): Weltmarkt der Bilder: Eine Philosophie der Visiotype. Stuttgart. 

Porombka, Stephan (2001): Hypertext: zur Kritik eines digitalen Mythos. München. 

Pratschke, Margaret (2008): Interaktion mit Bildern. Digitale Bildgeschichte am Beispiel 
grafischer Benutzeroberflächen. In: Bredekamp, Horst/Schneider, Birgit/Dünkel, Vera 
(Hg.): Das Technische Bild: Kompendium zu einer Stilgeschichte wissenschaftlicher Bilder. 
Berlin, 68-80. 

Prigann, Nadine (2018): Explorative Spatial Analysis. Zürich. Abgerufen am 4. 3. 2014 von 
http://nadineprigann.de/data/explorative_spatial_analysis_thesis_nadine_prigann.pdf. 

Quasthoff, Uta (1980): Erzählen in Gesprächen: linguistische Untersuchungen zu Strukturen 
und Funktionen am Beispiel einer Kommunikationsform des Alltags. Tübingen 
(Kommunikation und Institution). 

Redder, Angelika (1984): Modalverben im Unterrichtsdiskurs, Pragmatik der Modalverben am 
Beispiel eines institutionellen Diskurses. Tübingen. 

Rehbein, Jochen (1984): Beschreiben, Berichten und Erzählen. In: Ehlich, Konrad (Hg.): Erzählen 
in der Schule. Tübingen, 67-124. 

Reither, Saskia (2015): Computerpoesie. Studien zur Modifikation poetischer Texte durch den 
Computer. Bielefeld. 

Rohrdantz, Christian/Hund, Michael/Mayer, Thomas et al. (2012): The World’s Languages 
Explorer: Visual Analysis of Language Features in Genealogical and Areal Contexts. In: 
Computer Graphics Forum 31 (3pt1), 935-944, doi: 10.1111/j.1467-8659.2012.03086.x. 

Sachs, Klaus-Jürgen/Röder, Thomas (1989): Partitur. In: Finscher, Ludwig (Hg.): Die Musik in 
Geschichte und Gegenwart. Kassel. 


Bibliographie — 331 


Sacks, Harvey/Schegloff, Emanuel A./Jefferson, Gail (1974): A Simplest Systematics for 
the Organization of Turn-Taking for Conversation. In: Language 50 (4), 696-735, doi: 
10.2307/412243. 

Sager, Sven F. (2001): Formen und Probleme der technischen Dokumentation von Gesprächen. 
In: Brinker, Klaus/Antos, Gerd/Heinemann, Wolfgang/Sager, Sven F. (Hg.): Text- und 
Gesprächslinguistik / Linguistics of Text and Conversation. Berlin, New York (Handbücher 
zur Sprach- und Kommunikationswissenschaft, 16.2), 1022-1033. 

Salter, Colin (2014): Science Is Beautiful: The Human Body. London. 

Sankey, Henry Riall (1896): The Thermal Efficiency of Steam-Engines. In: Minutes ofthe 
Proceedings of the Institution of Civil Engineers 125 (1896), 182-212, doi: 10.1680/ 
imotp.1896.19564. 

Sauerbier, Thomas (2009): Statistiken verstehen und richtig präsentieren. München. 

Saussure, Ferdinand de (1916): Cours de linguistique générale. Paris. 

Savigny, Christofle de (1530?-1608?) Auteur du texte (1587): Tableaux accomplis de tous les 
arts libéraux , contenans... par singulière méthode de doctrine une générale et sommaire 
partition des dicts arts amassez et réduicts en ordre pour le soulagement et profit 
de la jeunesse, Paris. Abgerufen am 2. 6. 2016 von http: //gallica.bnf.fr/ark:/12148/ 
bpt6k122948d. 

Scharloth, Joachim/Bubenhofer, Noah (2011): Datengeleitete Korpuspragmatik: Korpus- 
vergleich als Methode der Stilanalyse. In: Felder, Ekkehard/Miller, Marcus/Vogel, 
Friedemann (Hg.): Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer 
Analysen von Texten und Gesprächen. Berlin, New York, 195-230. 

Scharloth, Joachim/Eugster, David/Bubenhofer, Noah (2013): Das Wuchern der Rhizome. 
Linguistische Diskursanalyse und Data-driven Turn. In: Busse, Dietrich/Teubert, Wolfgang 
(Hg.): Linguistische Diskursanalyse. Neue Perspektiven. Wiesbaden, 345-380. 

Scherner, Maximilian (1984): Sprache als Text. Ansätze zu einer sprachwissenschaftlich 
begründeten Theorie des Textverstehens. Forschungsgeschichte, Problemstellung, 
Beschreibung. Tübingen. 

Scheuringer, Hermann (2000): Mit den Methoden des 19. Jahrhunderts auf dem Weg ins 21. 
Jahrhundert? Vorschläge zur Standortbestimmung in der deutschen Dialektologie. In: 
Dialektologie zwischen Tradition und Neuansätzen. Stuttgart, 431-437. 

Scheuringer, Hermann (2010): Mapping the German language. In: Auer, Peter/Schmidt, Jürgen 
Erich/Lameli, Alfred (Hg.): Language and Space. An International Handbook of Linguistic 
Variation. Berlin, New York, 158-179. 

Schich, Maximilian/Song, Chaoming/Ahn, Yong-Yeol et al. (2014): A Network Framework of 
Cultural History. In: Science 345 (6196), 558-562, doi: 10.1126/science.1240064. 

Schiewe, Jürgen (1996): Sprachenwechsel - Funktionswandel - Austausch der Denkstile: Die 
Universität Freiburg zwischen Latein und Deutsch. Tübingen. 

Schiller, Anne/Teufel, Simone/Thielen, Christine (1995): Guidelines für das Tagging deutscher 
Textcorpora mit STTS. Stuttgart. 

Schleicher, August (1873): Die Darwinsche Theorie und die Sprachwissenschaft. Offenes 
Sendschreiben an Herrn Ernst Häckel. Weimar. Abgerufen am 7. 4. 2016 von http://archive. 
org/details/diedarwinscheth00schlgoog. 

Schlich, Thomas (1997): Die Repräsentation von Krankheitserregern. Wie Robert Koch Bakterien 
als Krankheitsursache dargestellt hat. In: Rheinberger, Hans-Jörg/Hagner, Michael/ 
Wahrig-Schmidt, Bettina (Hg.): Räume des Wissens: Repräsentation, Codierung, Spur. 
Berlin, 165-190. 


332 —— Bibliographie 


Schmandt-Besserat, Denise (1996): How Writing Came About. Austin. 

Schmeller, Johann Andreas (1821): Die Mundarten Bayerns grammatisch dargestellt. 
Beygegeben ist eine Sammlung von Mundart-Proben, d.i. kleinen Erzählungen, 
Gesprächen, Sing-Stücken, figürlichen Redensarten u. dergl. in den verschiedenen 
Dialekten des Königreichs, nebst einem Kärtchen zur geographischen Übersicht dieser 
Dialekte. München. 

Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. In: 
Proceedings of International Conference on New Methods in Language Processing. 
Manchester, UK. 

Schmid, Helmut (1995): Improvements in Part-of-Speech Tagging with an Application to 
German. Stuttgart. Abgerufen am 4. 3. 2014 von ftp://ftp.ims.uni-stuttgart.de/pub/ 
corpora/tree-tagger2.pdf. 

Schmidt, Jiirgen Erich/Herrgen, Joachim/Kehrein, Roland (Hg.) (2008): Regionalsprache. 
de (REDE). Forschungsplattform zu den modernen Regionalsprachen des Deutschen. 
Bearbeitet von Dennis Bock, Brigitte Ganswindt, Heiko Girnth, Simon Kasper, Roland 
Kehrein, Alfred Lameli, Slawomir Messner, Christoph Purschke, Anna Wolanska. Marburg. 
Abgerufen am 4. 3. 2014 von https://www.regionalsprache.de. 

Schmidt, Thomas (2014): The Research and Teaching Corpus of Spoken German - FOLK. In: 
Proceedings of the Ninth conference on International Language Resources and Evaluation 
(LREC’14). 383-387. 

Schmidt, Thomas (2016a): Construction and Dissemination of a Corpus of Spoken Interaction 
- Tools and Workflows in the FOLK Project. In: Journal for language technology and 
computational linguistics (JLCL) 31 (1), 127-154. 

Schmidt, Thomas (2016b): EXMARaLDA Partitur-Editor. Manual. Version 1.6. Abgerufen am 
25.1. 2018 von http: //www.exmaralda.org/pdf/Partitur-Editor_Manual.pdf. 

Schmidt, Thomas/Schütte, Wilfried /Winterscheid, Jenny (2015): cGAT. Konventionen für das 
computergestützte Transkribieren in Anlehnung an das Gesprächsanalytische Transkripti- 
onssystem 2 (GAT2). Mannheim. Abgerufen am 25.1. 2018 von https://ids-pub.bsz-bw.de/ 
frontdoor/index/index/docld/4616. 

Schmitz, Ulrich (2015): Das Wort in der Sehflache. In: Haß, Ulrike/Storjohann, Petra (Hg.): 
Handbuch Wort und Wortschatz. Berlin, Boston. 

Schneider, Jan Georg (2008): Spielräume der Medialität. Linguistische Gegenstandskons- 
titution aus medientheoretischer und pragmatischer Perspektive. Berlin, New York. 

Schnörch, Ulrich (2015): Wortschatz. In: Haß, Ulrike/Storjohann, Petra (Hg.): Handbuch Wort 
und Wortschatz. Berlin, Boston, 3-26. 

Schulz, Nina (2007): Das zeichnerische Talent am Ende der Kindheit. Münster. 

Selting, Margret (2009): Probleme der Transkription verbalen und paraverbalen/prosodischen 
Verhaltens. In: Brinker, Klaus/Antos, Gerd/Heinemann, Wolfgang et al. (Hg.): Text- und 
Gesprächslinguistik / Linguistics of Text and Conversation. Berlin, New York, 1059-1068. 

Selting, Margret/Auer, Peter/Barden, Birgit et al. (1998): Gesprächsanalytisches Transkripti- 
onssystem (GAT). In: Linguistische Berichte 173 , 91-122. 

Selting, Margret/Auer, Peter/Barth-Weingarten, Dagmar et al. (2009): Gesprächsanalytisches 
Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung. Online-Zeitschrift zur verbalen 
Interaktion 10, 353-402. 

Seizov, Ognyan/Wildfeuer, Janina (Hg.) (2017): New Studies in Multimodality. London, New 
York. 


Bibliographie — 333 


Sennrich, Rico/Schneider, Gerold/Volk, Martin et al. (2009): A New Hybrid Dependency Parser. 
In: Proceedings of GSCL-Conference. Potsdam. 

Shneiderman, Ben (1996): The Eyes Have It: A Task by Data Type Taxonomy for Information 
Visualizations. In: Proceedings ofthe 1996 IEEE Symposium on Visual Languages. 
Washington, DC, USA (VL ’96), 336-343. 

Siegel, Steffen (2009): Tabula: Figuren der Ordnung um 1600. Berlin, New York. 

Smith, Neil (1992): History and Philosophy of Geography: Real Wars, Theory Wars. In: Progress 
in Human Geography 16 (2), 257-271, doi: 10.1177/030913259201600208. 

Spitzmiiller, Jürgen/Warnke, Ingo H. (2011): Diskurslinguistik: eine Einführung in Theorien und 
Methoden der transtextuellen Sprachanalyse. Berlin, New York. 

SRI International (1968): 1968 Demo - FJCC Conference Presentation Reel #1. Abgerufen am 
21. 2. 2018 von http://archive.org/details/XD300-23_68HighlightsAResearchCntAugHuma 
nintellect. 

Stamatatos, Efstathios (2009): A Survey of Modern Authorship Attribution Methods. In: J. Am. 
Soc. Inf. Sci. Technol. 60 (3), 538-556, doi: 10.1002/asi.v60:3. 

Stathi, Ekaterini (2006): Greek Lexicography, Classical. In: Encyclopedia of Language and 
Linguistics. 2. Aufl. Oxford, 145-146. 

Stechow, Arnim von/Wunderlich, Dieter (Hg.) (1991): Semantik / Semantics. Ein internationales 
Handbuch der zeitgenössischen Forschung. An International Handbook of Contemporary 
Research. Berlin, New York. 

Steinseifer, Martin (2013): Texte sehen — Diagrammatologische Impulse für die Textlinguistik. 
In: Zeitschrift für germanistische Linguistik 41 (1), 8-39. 

Stellmacher, Dieter (1981): Niederdeutsch, Formen und Forschungen. Tübingen. 

Stetter, Christian (2005): Bild, Diagramm, Schrift. In: Schrift. Kulturtechnik zwischen Auge, 
Hand und Maschine. München (Kulturtechnik, 4), 113-136. 

Stjernfelt, Frederik (2007): Diagrammatology: An Investigation on the Borderlines of 
Phenomenology, Ontology, and Semiotics. Dordrecht, London. 

Stöckl, Hartmut (2004): Die Sprache im Bild - Das Bild in der Sprache. Zur Verknüpfung von 
Sprache und Bild im massenmedialen Text. Konzepte. Theorien. Analysemethoden. Berlin, 
New York. 

Storjohann, Petra (2015): 11. Sinnrelationale Wortschatzstrukturen: Synonymie und Antonymie 
im Sprachgebrauch. In: Haß, Ulrike/Storjohann, Petra (Hg.): Handbuch Wort und 
Wortschatz. Berlin, Boston, 248-273. 

Straus, Florian (2013): „Das Unsichtbare sichtbar machen“. 30 Jahre Erfahrungen mit 
qualitativen Netzwerkanalysen. In: Schönhuth, Michael/Gamper, Markus/Kronenwett, 
Michael et al. (Hg.): Visuelle Netzwerkforschung. Bielefeld, 33-58. 

Streck, Tobias/Auer, Peter (2012): Das raumbildende Signal in der Spontansprache: dialek- 
tometrische Untersuchungen zum Alemannischen in Deutschland. In: Zeitschrift für 
Dialektologie und Linguistik 79 (2), 149-188. 

Sturken, Marita/Cartwright, Lisa (2009): Practices of Looking: An Introduction to Visual Culture. 
Oxford. 

Sutrop, Urmas (2012): Estonian Traces in the Tree of Life Concept and in the Language Family 
Tree Theory. In: ESUKA - JEFUL 1 (3), 297-326. 

Tesniére, Lucien (1953): Esquisse d’une syntaxe structurale. Paris. 

Thomas, James J./Cook, Kristin A. (Hg.) (2005): Illuminating the Path: The Research and 
Development Agenda for Visual Analytics. Richland. 


334 —— Bibliographie 


Thompson, Clive K. (2019): Coders. Who They Are, What They Think and How They Are Changing 
Our World. London. 

Toulmin, Stephen (1958): The Uses of Argument. Cambridge. 

Toutenburg, Helge (2000a): Deskriptive Statistik. Eine Einführung mit SPSS für Windows mit 
Übungsaufgaben und Lösungen. Berlin, New York. 

Toutenburg, Helge (2000b): Induktive Statistik. Eine Einführung mit SPSS für Windows. 2. Aufl. 
Berlin, New York. 

Trudgill, Peter (1974): Linguistic Change and Diffusion: Description and Explanation in 
Sociolinguistic Dialect Geography. In: Language in Society 3 (2), 215-246, doi: 10.1017/ 
S0047404500004358. 

Trudgill, Peter (1983): On Dialect: Social and Geographical Perspectives. Oxford. 

Tufte, Edward R (1983): The Visual Display of Quantitative Information. Cheshire, CT. 

Tufte, Edward R. (1997): Visual Explanations: Images and Quantities, Evidence and Narrative. 
Cheshire, Conn. 

Tukey, John W (1977): Exploratory Data Analysis. Reading, Masachusetts [etc.] (Addison Wesley 
Series in Behavioral Science. Quantitative Methods). 

Turing, Alan M. (1936): On Computable Numbers. In: Proceedings of the London Mathematical 
Society. 230-265. 

Unsworth, John (2000): Scholarly Primitives: What Methods Do Humanities Researchers Have in 
Common, and How Might Our Tools Reflect This? Abgerufen am 11. 1. 2018 von http://www. 
people.virginia.edu/~jmu2m/Kings.5-00/primitives.html. 

Unwin, Antony/Theus, Martin/Hofmann, Heike (2006): Graphics of Large Datasets. Visualizing 
a Million. Berlin (Statistics and Computing). 

Veith, Werner H. (1994): Quantitative Dialektologie, Computerkartographie. In: Mattheier, 
Klaus/Wiesinger, Peter (Hg.): Dialektologie des Deutschen: Forschungsstand und Entwick- 
lungstendenzen. Tübingen (Reihe Germanistische Linguistik), 193-244. 

Wall, Larry (1999): Perl, the First Postmodern Computer Language. Abgerufen am 19. 8. 2015 von 
http: //www.wall.org/-larry/pm.html. 

Wampfler, Philippe (2017): Digitaler Deutschunterricht: neue Medien produktiv einsetzen, 
Pädagogik. Göttingen, Bristol. 

Wells, Christopher J. (1990): Deutsch. Eine Sprachgeschichte bis 1945. Tübingen. 

Wenker, Georg (1878): Sprach-Atlas der Rheinprovinz nördlich der Mosel sowie des Kreises 
Siegen. Nach systematisch aus ca. 1.500 Orten gesammeltem Material. Zusammen- 
gestellt, entworfen und gezeichnet von Dr. G. Wenker. Marburg. Abgerufen am 4. 3. 2014 
von hittps://regionalsprache.de/rheinprovinz.aspx. 

Wenker, Georg (1888): Sprachatlas des Deutschen Reichs. Marburg. Abgerufen am 4. 3. 2014 
von hittps://regionalsprache.de/wa.aspx. 

Werner, Gabriele (2008): Bilddiskurse. Kritische Überlegungen zr Frage, ob es eine allgemeine 
Bildtheorie des naturwissenschaftlichen Bildes geben kann. In: Bredekamp, Horst/ 
Schneider, Birgit/Dünkel, Vera (Hg.): Das Technische Bild: Kompendium zu einer Stilge- 
schichte wissenschaftlicher Bilder. Berlin, 30-35. 

White, Richard (2010): What ist Spatial History? Stanford, Calif. Abgerufen am 4. 3. 2014 von 
http: //www.stanford.edu/group/spatialhistory/cgi-bin/site/pub_toc.php. 

Wiedemann, Gregor (2016): Text Mining for Qualitative Data Analysis in the Social Sciences. 
Wiesbaden. 


Bibliographie — 335 


Wimmer, Rainer (1995): Eigennamen im Rahmen einer allgemeinen Sprach- und Zeichentheorie. 
In: Ungeheuer, Gerold/Wiegand, Herbert Ernst (Hg.): Namenforschung. Ein internationales 
Handbuch zur Onomastik. Berlin, New York, 372-379. 

Wisotzky, Karl Heinz (1989): Einsatz des Computers in Sprach- und Sachunterricht bei 
Hörgeschädigten. In: Bausch, Karl-Heinz/Grosse, Siegfried (Hg.): Spracherwerb 
und Sprachunterricht für Gehörlose. Zielsetzungen und Probleme. Tübingen (Reihe 
Germanistische Linguistik, 94), 100-114. 

Zittel, Claus (2014): Die Ordnung der Diskurse und das Chaos der Bilder. Bilder als blinde 
Flecken in Foucaults Diskursanalyse und in der Historiographie der Philosophie. In: Eder, 
Franz X./Kühschelm, Oliver/Linsboth, Christina (Hg.): Bilder in historischen Diskursen. 
Wiesbaden (Interdisziplinäre Diskursforschung), 85-107. 


Tabellen- und Abbildungsverzeichnis 


Tabellen 

Tab. 1: Klassifikation der Diagramme —— 63 

Tab.2: Ausgewählte Diagramme pro Jahr in der RGL—— 65 

Tab. 3: Zahlenvektor — 100 

Tab.4: _KWiC-Ansicht — 101 

Tab. 5: Index (Korpus: Das verwunschene Haus besaß weder Türen noch Fenster.) — 102 

Tab.6: Index alphabetisch —— 102 

Tab. 7: Frequenzindex —— 103 

Tab. 8: Ausgabe des Dependenzparsers ParZu (Sennrich et al. 2009), https://pub.cl.uzh.ch/ 
demo/parzu/ (letzter Zugriff: 22. 9. 2020) —— 160 

Tab.9: Liste mit Fantasiefrequenzen der Lexeme X und Y —— 167 

Tab. 10: Ausschnitt aus einer Liste von Geokollokationen: In der ersten Spalte steht 
das Toponym und in den letzten zwei Spalten der dazugehörige Kollokator mit 
Wortartklasse. Weitere Spalten: „freq“ = absolute Frequenz der Kollokation, „sig“ 
Signifikanzniveau p — 212 

Tab.11: Ausschnitt Perlscript „geoLinguistics.pl“: Kopf der Datei mit Aufgabenstellung und 
Versionsänderungen —— 216 

Tab.12: Ähnlichkeit von Ländern bezüglich Attribuierung mit Himmelsrichtungen —— 241 

Tab.13: Korpus Geburtsberichte („Wörter“ = laufende Wortformen) — 248 


Abbildungen 


Abb. 1: Ein Kreis als Diagramm oder Bild — 1 

Abb. 2: Ergebnis der Suche nach „Organonmodell“ in der Google-Bildersuche 
(27. 9.2017) — 12 

Abb. 3: Boxplot zur Verteilung von Personalpronomen in drei verschiedenen Korpora (aus: 
Bubenhofer 2013b) — 19 

Abb. 4: Tafeln „Musique“ von Savigny (1587), Gallica, Bibliothèque nationale de 
France — 36 

Abb.5: = Nature-Video zu Maximilian Schichs Network Framework of Cultural History (vgl. 
https://youtu.be/4gIhRkCcD4U, letzter Zugriff: 22.9. 2020) —— 42 

Abb.6: Der Visual Analytics-Process nach Keim et al. (2010: 10) — 45 

Abb.7: — Ultraschallbild eines Kindes im Leib seiner Mutter —— 47 

Abb. 8: Screenshot eines RSA Animate-Films von Andrew Park, veröffentlicht 2010, zu 
einem Vortrag des Philosophen Slavoj Zizek über sein Buch „First As Tragedy, Then 
As Farce“ (vgl. https: //www.youtube.com/watch?v=hpAMbpQ8j7g, letzter Zugriff: 
22.9. 2020) — 50 

Abb. 9: Darstellung der Ähnlichkeit von Sprachen (datenbasiert) im World’s Language 
Explorer (Rohrdantz et al. 2012) — 53 

Abb.10: Eine mit dem Webdienst „wortwolken.com“ erstellte Wortwolke des ersten Kapitels 
dieses Buches (Vorversion) — 58 

@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 


unter der Commons Attribution 4.0 Lizenz. 
https: //doi.org/10.1515/9783110698732-011 


338 —— Tabellen- und Abbildungsverzeichnis 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 
Abb. 


11: 


23: 


24: 


25: 


26: 


27: 


28: 


29: 


30: 


31: 


Wortwolke aus Bubenhofer/Scharloth (2011, 249); sie zeigt fiir die Zeit von 1960 bis 
1979 typische Lexeme in einem Korpus alpinistischer Texte im Vergleich zu friiheren 
Texten - erstellt mit der Software „Wordle“ (Feinberg 2010) — 59 

Website lifestyle-decor.de mit einem Angebot an „Wandtatoos“ in Form von 
Wortwolken — 60 

Übersicht der vorkommenden Diagrammtypen in den RGL-Bänden 1 (1975) bis 307 
(2016) — 66 

Übersicht zur zeitlichen Verteilung der Diagrammtypen in den RGL-Bänden 1 (1975) 
bis 307 (2016) (Bandperspektive; Daten = alle Diagramme, n = 2173) — 67 
Übersicht zur zeitlichen Verteilung der Diagrammtypen in den RGL-Bänden 1 (1975) 
bis 307 (2016) (Diagrammperspektive; Daten = alle Diagramme, n = 2173) — 69 
Zeitliche Verteilung der Diagrammfunktionen in den RGL-Bänden 1 (1975) bis 307 
(2016) (Diagrammperspektive) — 70 

Zeitliche Verteilung der Diagrammfunktionen in den RGL-Bänden 1 (1975) bis 307 
(2016) (Bandperspektive) — 70 

Zeitliche Verteilung der Diagrammtypen mit generellem Datenbezug in den 
RGL-Bänden 5 (1977) bis 307 (2016) (Bandperspektive; Daten = Datenbezug: Daten 
generell, n=581) — 71 

Verwendung von Diagrammen für die Darstellung von aggregierten empirischen 
Daten in den RGL-Bänden 5 (1977) bis 307 (2016) (Bandperspektive; 

Daten = Datenbezug: aggregierte Daten, n=480) — 72 

Diagramme, die theoretische Modelle repräsentieren, in den RGL-Bänden 1 (1975) bis 
303 (2015) (Bandperspektive; Daten = repräsentiert Modell, n = 1107) — 73 
Beispiel für eine Graphdarstellung eines theoretischen Modells (Stellmacher 1981, 
77) — 74 

Beispiel für ein Flussdiagramm („Verlaufsdiagramm“) zur theoretischen 
Modellierung einer turn-Organisation - klassifiziert als Anwendung eines Modells 
(Redder 1984, 127) — 74 

Beispiel für ein Venn-Diagramm mit Integration eines Graphen zur Repräsentation 
eines Modells des Zusammenspiels von Verstehensfaktoren (Scherner 1984, 

85) — 75 

Beispiel für eine Kombination von Karte und dreidimensionalem Venn-Diagramm und 
gleichzeitig eine Zitation des Diagramms (Wells 1990, 393), Originaldiagramm bei 
König (1978, 132) — 75 

Beispiel für ein Diagramm mit Datenbezug (Zusammenfassung als eine Art 
Mosaik-Plot) (Hoppenkamps 1977, 216) — 76 

Zusammenspiel von Datentabellen und Diagramm zur Darstellung statistischer 
Analysen (Wisotzki 1989, 108-109) — 77 

Diagramme in der Grammatik von Port Royal (Arnauld/Lancelot 1660, 61, 

84) — 79 

Beispiel für eine Tabelle (Ausschnitt) für den Sprachvergleich anhand ausgewählter 
Lexeme (Humboldt 1838, 241) — 79 

Die semiotischen Dreiecke von Ogden/Richards (1923, 11) und Morris (1938, 

94) — 82 

Diagramm —— 83 

Skizze von Bushs „Memex“ im Originaltext (Bush 1945, 123) ——105 


Abb. 


Abb. 


Abb. 
Abb. 
Abb. 


Abb. 


Abb. 
Abb. 
Abb. 


Abb. 
Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 
Abb. 


Abb. 
Abb. 
Abb. 
Abb. 
Abb. 


Abb. 


32: 


33: 


34: 


35: 


36: 


37: 


38: 
39: 
40: 


41: 


42: 


43: 


4A: 


45: 


46: 


47: 


48: 


49: 
50: 


51: 


52: 
53: 
54: 
55: 


56: 


Tabellen- und Abbildungsverzeichnis —— 339 


Standbilder aus der NLS-Demo von Douglas Engelbart von 1968 (SRI International 
1968) — 114 

Beispiel einer Diskussion auf der Plattform „Stackoverflow“ unter dem Titel „Isthere 
a better syntax for subsetting a data frame in R?“, wobei die Kategorie „Schönheit“ 
eine zentrale Rolle spielt (https://stackoverflow.com/questions/13179792/is-there- 
a-better-syntax-for-subsetting-a-data-frame-in-r, 22.9. 2020) — 125 

Demo der Javascript-Bibliothek P5 durch Lauren McCarthy und Ben Shiffman (http: // 
hello.p5js.org, 22.9. 2020) — 130 

Codex Abrogans, St. Gallen, Stiftsbibliothek, Cod. Sang. 911, p. 4 - Abrogans - 
Vocabularius (Keronis) et Alia; erste Seite des Wörterbuches —— 136 

St. Gallen, Stiftsbibliothek, Cod. Sang. 913, p. 181 - Vocabularius S. Galli —— 137 
Mahmoud al-Kashgaris Karte der Sprachen aus dessen Diwan (11. Jhd.) - Quelle: 
https://commons.wikimedia.org/wiki/File:Kashgari_map.jpg (letzter Zugriff: 
22.9.2020) — 140 

Verteilung der Mundarten in Bayern nach Schmeller (1821) — 141 

Legende (Ausschnitt) zu Schmellers Karte (Schmeller 1821, 427) — 143 
Ausschnitt von Wenkers Sprachatlas, Karte 276, VI-23-Wortende: [e]s - anders 
(Wenker 1888), in der digitalen Version „Digitaler Wenker-Atlas (DiWA)“ (Schmidt et 
al. 2008) — 144 

Karte zur Verbreitung des uvularen /r/ in Europa von Trudgill (1974, 220) — 146 
Kartierung der Ergebnisse einer kombinierten Clusteranalyse mit den Verfahren 
„Weighted Average“ und „Group Average“, Rauschfaktor 0,5 / 50 Wiederholungen 
(r= 0,847) - (Streck/Auer 2012, 176) — 147 

Karl Haags Karte zu Dialekträumen basierend auf einem Distanzmessverfahren 
(Haag 1901, 237) — 148 

Beispiel aus der Musica Enchiriadis, Dasia-Notation zweier Stimmen. Msc. 
Var.1.fol51r, Staatsbibliothek Bamberg (Hoger <von Werden> et al. 1000) —— 153 
Beispiel einer Transkription in Partiturschreibweise bei Ehlich und Rehbein (Ehlich/ 
Rehbein 1976, 28) — 155 

Markierung von überlappenden turns bei Sacks et al. (1974, 73) — 156 

Beispiel für die Notation von Überlappung in GAT (Selting et al. 1998, 99) — 158 
Bildschirmfoto der Software EXMARaLDA mit ausgeprägter Partituranordnung 
(Schmidt 2016b) — 159 

Grafische Ausgabe des Dependenzparsers ParZu (Sennrich et al. 2009) — 161 
Beispiel für eine Mischung aus vertikalisiertem Text und XML-Annotation im 
Text+Berg-Korpus (Bubenhofer et al. 2015b) — 163 

Beispiel für eine simple XML-Struktur — 164 

Streudiagramm Fantasiefrequenzen für X und Y von acht Objekten —— 168 
Klassifikation von Baumgraphen bei Lima (2014, 4-5) — 173 

Baumdiagramm von Harleman Stewart (1976, 26) — 175 

Beispiel für einen Merkmalsbaum zur Bedeutung von „bachelor“; w1= Junggeselle, 
w2 = angehender Ritter, w3 = Bachelor-Student/in, w4 =Jungtier; + bedeutet: 
Merkmal ist relevant; - bedeutet: Merkmal ist nicht relevant (Harleman Stewart 1976, 
30) — 176 

Drei verschiedene Stemma-Formen, mit der Tesniére seine Dependenzsyntax 
einführt (Tesniére 1953, 3) — 177 


340 —— Tabellen- und Abbildungsverzeichnis 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 


Abb. 
Abb. 
Abb. 
Abb. 
Abb. 
Abb. 
Abb. 


Abb. 


Abb. 


Abb. 


Abb. 
Abb. 


Abb. 
Abb. 
Abb. 


Abb. 
Abb. 


Abb. 
Abb. 


57: 


58: 


59: 


60: 


61: 


62: 


63: 
64: 
65: 
66: 
67: 
67: 
68: 


69: 


70: 


71: 


72: 
73: 


74: 
75: 
76: 


77: 
78: 


79: 
80: 


DWDS-Wortverlaufskurve für „Netzwerk“, erstellt durch das Digitale Wörterbuch der 
deutschen Sprache, abgerufen am 22. 9. 2020. Abfrage: https://www.dwds.de/r/ 
plot?view=1&norm=date%2Bclass&smooth=spline&genres=0&grand=1&slice=10& 
prune=0&window=3&wbase=0&logavg=0&logscale=0&xrange=1800%3A2016&q1 
=Netzwerk —— 181 

Skizze der sozialen Beziehungen einer Kindergartengruppe von Moreno (1934, 

34) —— 182 

Darstellung eines Netzes von nach satzsemantischen Rollen gruppierten 
Kollokatoren zu „Wortschatz“ mit Hilfe des Werkzeugs „VICOMTE“ bei Schnörch 
(2015, 23) — 189 

Demonstration des Programms GraphColl mit der Ausgabe von Kollokatoren bis zu 
vierter Ordnung ausgehend von ,,time“ (Brezina et al. 2015, 153) ——190 

Ein Modell eines hierarchisch organisierten Wortschatzes nach Lyons (1977, 

295) — 191 

„Network representation ofthree semantic relations among an illustrative variety of 
lexical concepts“ in WordNet (Miller 1990, 260) — 192 

Darstellung der fünf diagrammatischen Grundfiguren — 193 
Rekontextualisierung — 194 

Desequenzialisierung —— 197 

Dimensionsanreicherung — 199 

Darstellung von Koordinaten auf x- und y-Achsen — 201 

Darstellung von Koordinaten auf x- und y-Achsen — 201 

Vorversion einer Darstellung von Wörtern in der Umgebung von 
Toponymen —— 217 

Dendrogramm einer Clusterberechnung von Toponymen aufgrund ihrer Kollokati- 
onsprofile: Toponyme, die im Dendrogramm dem gleichen Zweig angehören, haben 
ähnliche Kollokationsprofile (Datengrundlage: Korpus Zeit/Spiegel 2010-2016, 
Kollokatoren mit p <= 0.0001 und Mindestfrequenz 11, 15600 Kollokatoren, 
Clustering ward, euklidische Distanz) —— 219 

Ausschnitt aus einer mit R produzierten Karte von Geokollokationen (Korpus: 
Bundestag WP 17, CDU/CSU-Fraktion) — 221 

Vollansicht einer mit R produzierten Karte mit Geokollokationen (Korpus: Bundestag 
WP 17, Fraktion Die Linke) — 222 

Die Arbeit mit einem R-Script in R-Studio — 224 

Google Suchtrends für die angegebenen Suchbegriffe (vgl. https://trends.google. 


de); Suchinteresse in Prozent in Relation zum höchsten Wert —— 226 
Webinterface Geokollokationen Version 1: Übersicht — 227 
Darstellung der Kollokatoren als Listen oder Punkte —— 228 


Geokollokationen Version 1: Auswahl von Kollokatoren, die eine der folgenden 
Zeichenketten enthalten: geld, wirtschaft, bank, finanz —— 229 

Geokollokationen Version 1: Darstellung von Sachgruppen nach Dornseiff —— 230 
Konsolenansicht im Browser (Apple Safari) bei der Nutzung der Geokollokationen- 
Anwendung; Ausgabe der Struktur und Inhalte der Variable „data“ (Ausschnitt). 
Diese Ausgabe ist in jedem Client erzeugbar —— 233 

Version 2 der Geokollokationen-Anwendung; Übersicht — 234 
Geokollokationen Version 2: Tooltip-Menü für die Anzeige der 

Kollokatoren —— 235 


Abb. 
Abb. 
Abb. 


Abb. 
Abb. 
Abb. 


Abb. 


Abb. 
Abb. 


Abb. 


Abb. 
Abb. 


Abb. 


Abb. 
Abb. 


Abb. 
Abb. 


Abb. 
Abb. 
Abb. 


Abb. 
Abb. 
Abb. 
Abb. 
Abb. 
Abb. 


Abb. 
Abb. 


Abb. 


Abb. 


81: 
82: 
83: 
84: 
85: 
86: 


87: 


88: 
89: 


90: 


91: 
92: 


93: 


94: 
95: 


96: 
97: 


98: 
99: 


100: 
101: 
102: 
103: 
104: 
105: 


106: 


107: 
108: 


109: 


110: 


Tabellen- und Abbildungsverzeichnis — 341 


Geokollokationen Dorling-Darstellung; Flucht-Diskurs 1961-1980 —— 237 
Geokollokationen Dorling-Darstellung; Flucht-Diskurs 2000-2016 —— 237 
Beispiel für ein Elternschaftsforum, hier „swissmom“ (angezeigte Werbung hier 
nicht abgebildet) — 247 

Korpus Geburtsberichte: Verteilung der Texte über Foren und Jahre — 249 
Tabellenstruktur der Datenbank nGrams (vereinfachte Darstellung) — 254 
nGrams-Viewer als hierarchische Liste (vgl. https: //korpuspragmatik.ds.uzh.ch > 
nGrams-Viewer, zuletzt geprüft: 22.9. 2020) — 255 

Die Verteilung (typische Positionen) der n-Gramme in den Geburtsberichten 
(Korrelation von durchschnittlicher Position und Standardabweichung; Daten: 
Geburtsgeschichten aus Online Foren, die häufigsten 1609 n-Gramme; vgl. www. 
bubenhofer.com/visuallinguistics/ für eine interaktive Version) — 257 
Dreidimensionale Darstellung der n-Gramme in den Geburtsberichten —— 258 
Dreidimensionale Darstellung der n-Gramme in den Geburtsberichten: Weiter- 
führende statistische Informationen —— 259 

Vorder- und Draufsicht der dreidimensionalen Darstellung offenbaren 
unterschiedliche Zusammenhänge. —— 261 

Small Multiple-Diagramm Dichteverteilung Wortarten (n = 3074387) — 262 
Narrationsgraph der Erzählungen der Frauen zum „Ersten Mal“ (Bubenhofer et al. 
2013, Grafik: Joachim Scharloth) — 264 

Oberfläche von NarrViz zur Visualisierung narrativer Strukturen (in Zusammenarbeit 
mit Katrin Affolter 2016b). —— 265 

NarrViz Info-Panel —— 265 

Darstellung von positional wenig fixierten (Knoten mit Balken) und fixierten (Knoten) 
n-Grammen in NarrViz. —— 267 

NarrViz Einstellmöglichkeiten (Filterung). — 267 

Genese des Layouts der Graphdarstellung in NarrViz nach Import der 

Daten. — 268 

NarrViz Geburtsberichte: Zentrale Knoten. — 270 

Auffällige Momente in den Geburtsberichten (datengeleitete Perspektive) — 272 
Integrierendes Modell der narrativen Muster in den Geburtsberichten (vgl. 
Bubenhofer 2018b) — 274 

Installation „Explorative Spatial Analysis“ auf Basis der Geburtsbericht-Analysen 
von Nadine Prigann (2018). Vgl. http://nadineprigann.de/explorativespatialanalysis. 
html/ (letzter Zugriff: 22.9. 2020) — 278 

Beteiligungsstrukturen grafisch visualisiert —— 285 

Kombination von Typen und statistischen Angaben (Boxplot) — 286 

Grafische Abbreviaturen von Gesprächsdynamik —— 287 

Verschiedene Diagramme in Kombination —— 288 

Jahresringe als Metapher für Gespräche (Foto: Arnoldius, https://commons. 
wikimedia.org/wiki/File:Tree_rings.jpg, letzter Zugriff: 22. 9. 2020) — 289 


Anwendung Jahresringe, Transkript und Jahresringe-Darstellung — 290 
Drei Gespräche im Vergleich: Spielinteraktion mit Kindern, Pausenkommunikation 
zweier Besucherinnen im Theater, Unterrichtsstunde Gymnasium —— 291 


Zwei verschiedene Zeitpunkte im gleichen Gespräch (Pausenkommunikation 
Theater) — 292 
Integrales Modell diagrammatischen Operierens in der Linguistik —— 300 


342 —— Tabellen- und Abbildungsverzeichnis 


Abb. 111: Skizze des Digital Conversation Analysis and Feedback Table (Rendering: Maaike 
Kellenberger) —— 313 

Abb. 112: Gedichtautomat „Goettherina“ (vgl. www.bubenhofer.com/visuallinguistics/ für eine 
Demo) — 315 


Register 


3D 258 
3D-Drucker 116 


Abrogans 135 

Achsendiagramm 76; siehe auch Diagramm 
AJAX 256 

Algorithmus 5, 90, 98, 118, 187, 304, 316 

- Algorithmisierung 114 

Alignierung 162, 169 

al-Kashgari, Mahmoud 139, 145 

Allegorie 202 

Alltagserzählung 244; siehe auch Erzählung 
Analyse, datengeleitete 269 

Analytical Engine 108 

Annotation 162 

Arduino 315 

Aristoteles 172 

Arnauld, Antoine 78 

Ästhetik 59, 185, 187, 301 

Austin, John 81 

Autorschaftsattribution 304 


Babbag, Charles 108 

Back-Channel-Behaviour 159 

Bag-of-words-Ansatz 198, 251, 300 

Bakteriologie 48 

Balkendiagramm 76, 170, 205; siehe 
auch Diagramm 

Bally, Charles 80 

Basteln 316 

Baum- 

-Baumdiagramm 96, 170, 277; siehe 
auch Diagramm 

-Baumgraph 255; siehe auch Graph 

- Baumstruktur 164, 171 

- Stammbaum 52 

Begriffsbaum 37 

Benzécri, Jean-Paul 40 

Bertin, Jacques 30 

Beweismittel 49 

Big Data 40 

Bild 

- Bild, normales 46 

- Bildlichkeit 310 


— Bildwissenschaft 7 
-Zahlenbild 57 
Blickrichtung 282 
Blog 166 

Bott, Elizabeth 182 
Boxplot 266, 286 
Bricolage 123, 312 
Buchdruck 117, 137 
Bühler, Karl 11, 81 
Busa, Roberto 106, 117 
Bush, Vannevar 105 


Calc 127 

Castell, Manuel 183 

CERN 54 

Cholera Karte 40 

CLAVIN (Cartographic Location And Vicinity 
INdexer) 214 

Client 232 

Closed Source 129 

Cluster 240, 304 

-Clusteranalyse 146, 260 

Code 123 

-Codierung 99, 114, 117 

Coding Culture 30, 94, 119, 123, 216, 225, 
232, 239, 256, 268, 277, 295, 301, 308, 
311 

Computer 29, 90, 94, 98, 108, 303 

- Computerlinguistik 304 

- Computerstimme 279 

Corpus Workbench 250, 268 


D3 130, 225, 239, 268 

Darwin, Charles 52, 174 

Dasia-Notation 152 

Data Mining 41 

Datenbank 166, 231 

- Datenbank, relationale 254 

Datenstrom 166 

Dekontextualisierung 193 

Deleuze, Gilles 57 

Demo 111, 130 

Dendrogramm 146, 218; siehe 
auch Diagramm 


@ Open Access. © 2020 Noah Bubenhofer, publiziert von De Gruyter. Dieses Werk ist lizenziert 


unter der Commons Attribution 4.0 Lizenz. 
https: //doi.org/10.1515/9783110698732-012 


344 — Register 


Denkkollektiv 91 

Denkstil 5, 33, 51, 54, 91, 279, 295, 301, 304, 
307 

Dependenz 

—Dependenzparser 160; siehe auch Parser 

-Dependenzschema 73, 96 

Desequenzialisierung 196, 238, 244, 276, 
293, 299 

Diagramm 14 

-Achsendiagramm 76 

-Balkendiagramm 76, 170, 205 

-Baumdiagramm 96, 170, 277 

-Dendrogramm 146, 218 

- Diagrammfunktion 68 

- Diagrammtyp 66 

-Fahnendiagramm 95-96 

-Liniendiagramm 170 

-Netzdiagramm 96, 170, 179 

- Streudiagramm 168, 170, 256, 276 

Diagrammatik 5-6 

Dialektkarte 98 

Die-große-Antwort-Paradigma 41 

Digital Humanities 5, 98 

Digitalisierung 100 

Dimensionsanreicherung 199, 260, 276, 299 

Diskurs 209 

- Diskursanalyse 51 

— Diskurslinguistik 195 

Distant Reading 99 

Distributionssemantik 170 

doingimages 46 

Doppelhelix 56 

Dorling-Karte 151, 235 

Dornseiff 222 

Dreieck, semiotisches 81 


Ecken 170 
Einkaufsliste 113 
Elasticsearch 231 
Empirie 71 
Engelbart, Douglas 107, 111 
ENIAC 108 
Enzyklopädie 37, 135 
Epistemizität 283 
Erkenntnistheorie 33 
Erya 138 

Erzählung 244 


-Alltagserzdhlung 244 
- Erzählfunktion 273 

- Erzähltheorie 244, 273 
Euler, Leonhard 180 
Evaluation 305 
Evolutionstheorie 52 
Excel 121, 127, 215 
EXMARaLDA 158 
Exploration 44 

Eye Tracking 282 


Fahnendiagramm 95-96; siehe 
auch Diagramm 

Fernrohr 93 

Flächigkeit 20 

Fleck, Ludwik 33, 54, 91 

FOLK-Korpus 290 

Formatierung 114 

Formulierungsmuster 246; siehe 
auch Muster 

Forschungslogik 304 

Foucault, Michel 51, 195 


Gamedesign 277 

GAT; siehe Gesprächsanalytisches Transkrip- 
tionssystem GAT 

Gates, Bill 129 

Gazetteer-System 214 

Gebrauchsbedeutung 90 

Gebrauchsbilder 7; siehe auch Bild 

Geburtsbericht 245 

Gender 312, 316 

Generative Grammatik 178 

Geokollokation 151, 209, 302 

Georeferenzierung 212 

Gephi 185 

Gerichtetheit 22; siehe auch Graph, 
gerichteter 

Gespräch 83 

- Gesprächsanalyse 151, 154, 285 

- Gesprächsanalytisches Transkripti- 
onssystem GAT 157-158, 302 

- Gesprächslinguistik 280 

- Gesprächstranskript 22, 24, 83, 151 

Gestalt 92 

GIS 140 

Glosse 135, 194 


- Glossierung 310 

Goldstandard 305 

Google Maps 215, 218 

Grammatik von Port Royal 78 

Graph 96, 134, 164, 170, 192, 196, 294 
- Graph, gerichteter 171 

- Graph, ungerichteter 171 
-Baumgraph 255 

- Graphdarstellung 277 
-Graphismus 21 

- Narrationsgraph 263 

- Netzgraph 253 

- Netzwerkgraph 184, 311 
GraphColl 189 

Grimm’sches Wörterbuch 137 
Grundfiguren, diagrammatische 133 
Guattari, Félix 57 


Haag, Karl 147 

Hacking 123, 301, 312, 316 

Haeckel, Ernst 52 

Halbinterpretative Arbeitstrankriptionen 
(HIAT) 154 

HTML 164, 215, 250 

-HTML5 292 

Humboldt, Wilhelm von 78 

Hypertext 106, 111 

Hypoikon 16 


IBM 129 

Iconic Turn 310, 314 

Ikon 6,15 

Index 6, 15, 101, 106, 135, 138, 215 
Index Thomisticus 106 
Informationssystem, geografisches 140 
Installation 278 

Instrument 93 

interactive computing 110, 115 
Interaktionale Linguistik 280 
Interaktionsdesign 279 

Interface 316 

Isoglosse 143 


Jahresringe 289, 302 
Javascript 124, 127, 215, 225, 239, 255, 264, 
268, 292, 295, 301 
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JSON 166, 268 
Junggrammatiker 150 


Kanon 203, 277, 301, 307 

-Kanonisierung 49, 94, 131 

Kanten 170 

Karte 96, 134, 139, 192, 196, 200, 215, 239, 
294 

- Karte, kaumgeografische 150 

- Karte, nichtgeografische 150 

-Cholera Karte 40 

Kartographie, kritische 235, 239 

Key Word in Context 96, 101, 138, 194, 287 

Knoten 170 

Koch, Robert 48 

Kollokation 189, 192, 211, 252, 263, 276 

-Kollokationsprofil 100, 138, 169, 196, 210, 
218 

Komplexitätstopos 180; siehe auch Topos 

Komponentenanalyse 174 

Königsberger Brückenproblem 180 

Konkordanz 96, 194 

Konstituentenanalyse 174 

Kontextualismus 169 

Koordinatensystem 140 

Körper 48 

Korpus 250, 316 

- Korpuslinguistik 100, 202, 280-281, 285, 
304 

- Parallelkorpus 169 

Kult 122 

Kultur 6 

KWiC; siehe Key Word in Context 


Lancelot, Claude 78 
Laplace, Pierre-Simon 39 
Laryngograph 314 
LaTeX 124 
Lautsprecher 279 
Layoutprinzip (für ungerichtete 
Graphen) 187; siehe auch Graph 
LibreOffice 127 
Linearität 196 
Liniendiagramm 170; siehe auch Diagramm 
Liste 134,192, 194, 238, 255, 294, 304, 310 
-Liste, lexikalische 135 
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Lochkarte 107, 110 
Lovelace, Ada 108 
Lucene 231 


Magnetresonanztomographie 46 

Mapping 202 

Maschine, diagrammatische 29, 116 

Maßstab 140 

Materialität 13 

McCarthy, Lauren 130 

Medialität 13, 27, 310 

Medizin 46 

Mehrwert, pragmatischer 44; siehe 
auch Pragmatik 

Memex 105 

Metamedium 108-109, 303 

Microblogging 166 

Microsoft 127 

Mikrofilm 105 

Mikrofon 314 

Mikroskop 48, 93 

Monges, Gaspard 38 

Moreno, Jacob Levy 182 

Morris, Charles William 81 

Mosaik-Plot 76 

Multimodalität 310, 313 

Musica enchiriadis 152 

Musik 151 

Muster 

— Muster, narratives 269, 274 

—Formulierungsmuster 246 

— Musterhaftigkeit 276 

— Sprachgebrauchsmuster 246, 269 


Narration 

—Narrationsforschung 244 

—Narrationsgraph 263; siehe auch Graph 

NarrViz 264, 277 

Naturwissenschaft 46 

Netzdiagramm 96, 170, 179; siehe 
auch Diagramm 

Netzgraph 253; siehe auch Graph 

Netzwerk 181 

- Netzwerk, soziales 166, 181; siehe 
auch Social Media 

- Netzwerkforschung 312 

— Netzwerkgesellschaft 183 


- Netzwerkgraph 184, 311 

n-Gramm 250, 305 

nGrams-Viewer 255 

NoSQL 231 

Novitätstopos 180; siehe auch Topos 
Nukleus 177 


Ogden, Charles Kay 81 

oN-Line System 111 

Open-Data 121 

OpenOffice 127 

Open Source 124, 131, 239, 277, 301, 316 
Operation 

- Operation, algorithmische 29 

- Operation, diagrammatische 111, 115 

- Operationalität 16, 25 
Organon-Modell 11 


P5 130 

Paper.js 292, 295 

Papier 115 

Parallelkorpus 169; siehe auch Korpus 

Paraphrase 84 

Park, Andrew 50 

Parser 161 

- Dependenzparser 160 

Partitur 86, 134, 151, 192, 196, 203, 280, 
284, 285, 302 

- Partiturschreibweise 83 

PDF 223 

Peirce, Charles Sanders 6,15, 81 

Perl 122, 124-125, 128, 215 

Perspektiventopos 180; siehe auch Topos 

Photoshop 186 

PHP 255 

Platon 26, 172 

Playfair, William 39 

Plinius 29 

Polyphonie 151, 282 

PostgreSQL 231, 254 

Pragmatik 81, 281 

- Mehrwert, pragmatischer 44 

Praktiken/Praxis 6, 13, 28, 33, 49, 83, 90, 
120, 206, 279, 303 

- Praktiken, kommunikative 93 

Präscript 84 

Präsentationsgrafik 44 


Processing 130 
Programmcode 115 
Programmieren 120 

- Programmiersprache 96, 110 
- Programmierung 94 
Projektion 29 

Prosodie 156 

Purismus-Topos 122, 124 
Python 124, 126, 128, 268, 315 


Quellcode 129, 131 
Quetelet, Adolphe 39 


R 57, 96, 121, 124, 127, 221; siehe 
auch RStudio 

Rapid Selector 106 

Rechenmaschine 108 

Referenzialität 24 

Rekontextualisierung 56, 193, 238, 276, 293, 
299, 304 

Rekurrenz 88 

Relationalität 22,199 

Rematerialisierung 201, 299 

Remediatisierung 84, 119 

Richards, Ivan Armstrong 81 

Röntgenaufnahme 46 

RStudio 127, 224-225 


Sankey-Diagramm 234 

SAS 129 

Saussure, Ferdinard de 80, 196 
Savigny, Christophe de 36 
Schematismus 23 
Schlagwortwolke 57; siehe auch Wortwolke 
Schleicher, August 52, 174 
Schmeller, Johann Andreas 142, 145 
Schreibmaschine 109 

Script 84 

- Scriptsprache 129, 216 

Searle, John 81 

Sechehaye, Albert 80 

Sehfläche 21 

Selbstreferentialität 89 

Semantik 188, 209 

- Distributionssemantik 170 
Semiotik 

- semiotisches Dreieck 81 
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- Transsemiotik 313 

Sequenzialität 197, 244, 260, 276, 282, 300 

Server 232 

SGML 164 

Shiffman, Dan 130 

Shiny 225 

Signifiant 174 

Signifie 174 

Simultaneität 23 

Sinnerzeugung 84 

Skriptur 84 

Small Multiples 262 

Smartphone 166 

Snow, John 40 

Social Media 166, 181, 310; siehe 
auch Netzwerk, soziales 

Software 87,158 

- Software, proprietäre 129 

— Software Studies 5, 87, 121, 312 

Sonogramm 46 

Sozialität 25, 282, 293 

Soziometrie 182 

Sprachatlas 144 

Sprachfamilie 52 

Sprachgebrauch 281 

- Sprachgebrauchsmuster 246, 269; siehe 
auch Muster 

Sprachgeschichte 145, 174 

Sprachspiel-Linguistik 90 

Sprachtypologie 174 

SPSS 121 

SQL 231 

Stammbaum 52; siehe auch Baum- 

Standoff-Annotation 165 

Stanford Named Entity Recognizer 211 

Stemma 177 

—Stemmatisierung 37 

Stil 92, 312 

Störung 123, 201, 205 

- Störungs-Prinzip 86 

Stream 166, 311 

Streudiagramm 168, 170, 256, 276; siehe 
auch Diagramm 

SVG 223 

Symbol 6, 15 

Synopse/Synopsis 20, 23 
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Tabelle 127, 135 Verfahren 
Tagcloud 57 - Verfahren, bildgebendes 46 
Taxonomie 174 - Verfahren, transkriptives 84, 308; siehe 
TED-Talk 179 auch Transkriptivität 
Telefonistinnen 314 Verhältnis, ikonisches 15; siehe auch /kon 
Tesniere, Lucien 73,177 Videoaufnahme 282 
TeX 124 Virtual Reality 20, 88, 303, 314 
Text Visiotype 19, 56 
- Textlinguistik 32 Viskurse 54 
—Textmining 202 Visual Analytics 5, 40, 93, 98, 243, 256 
- Textverarbeitung 99 Visualisierung 33 
Thesaurus linguae latinae 104, 139 - Visualisierung, algorithmische 99 
Token 6 - Visualisierung, interaktive 258 
Tonhöhe 156 — Visualisierung, wissenschaftliche 34 
Toponym 209 - Visualisierungsprinzip 202, 294, 301, 307 
Topos 122 
-Topos, erzählerisches 270 Wall, Larry 122, 128 
-Komplexitätstopos 180 Wandtatoo 60 
- Novitätstopos 180 Web-2.0 183 
- Perspektiventopos 180 Wenker, Georg 143 
Toulminschema 73, 96 Whiteboard Animation 50 
Trail 106 White Box 224, 239, 277 
Transformation 83 Wissensordnung 36 
- Transformation, diagrammatische 80, 200, Wittgenstein, Ludwig 81 

300 wordcloud 221; siehe auch Wortwolke 
Transkript 280 Word Embedding 169 
Transkription 115, 119, 201, 316 WordNet 191 
Transkriptivität 27, 84, 313; siehe Wörterbuch 104, 116, 135 

auch Verfahren, transkriptives Wortschatz 188 
Transparenz 187 Wortwolke 57, 150, 221 
Transsemiotik 313; siehe auch Semiotik WYSIWYG 110, 186 
TreeTagger 210, 250 
Tukey, John 40 XML 158, 163, 166, 215, 250, 286 
turn 156, 203, 282, 290 

Yiching 138 
Ultraschallbild 46, 55 
Utilitarismus-Topos 122 Zahlenbild 57 
Zahlenvektor 100, 167; Siehe auch Vektor 

Validitat 306 Zeichen 83 
Variationslinguistik 141 -Zeichentypen 6 
Vektor 101, 113, 134, 167, 192, 196, 210, 238, Zeitlichkeit 282, 293 

256, 276, 304 Zettelkasten 37 
-Vektorraum 169, 304 Zitation 73 
-Zahlenvektor 100, 167 Zizek, Slavoj 50 


Verdatung 99, 138, 167, 304 


